sql >> データベース >  >> NoSQL >> HBase

CDPの運用データベース

    編集者注、2020年8月:CDPデータセンターはCDPプライベートクラウドベースと呼ばれるようになりました。詳細については、こちらをご覧ください。

    CDPのClouderaの運用データベース(OpDB)は、統合された運用およびウェアハウジングプラットフォーム内で、従来の構造化データと新しい非構造化データを提供する、リアルタイムで常に利用可能なスケーラブルなOpDBを提供します。 Clouderaは、統合されたオープンソースプラットフォーム内で、従来の構造化データと新しい非構造化データを提供する運用データベースを提供します。

    運用データベースは、次のことに役立ちます。

    機械学習/人工知能を運用して、ヘルスケア、公益事業などのセクターに革命をもたらします。

    • Webスケールでリアルタイムコンテンツを提供します。
    • 運用およびオフラインでの使用のためにビッグデータ分析を強化します。
    • 回復力のある記録の保管場所として使用します。

    CDPのOpDBは、現在2つのフォームファクタで利用できます。CDPパブリッククラウドの完全に安全なセミマネージドオファリング(データハブ)と、CDPデータセンターの完全にカスタマイズ可能なオファリング(CDHおよびHDPですでに利用可能なものと同様)です。展開戦略とOpDBのニーズに基づいてフォームファクターを選択できます。オペレーショナルデータベースは、AmazonS3などのオブジェクトストアをApacheHBaseのストレージレイヤーとして使用します。HFileはオブジェクトストアに書き込まれますが、WALはHDFSに書き込まれます。

    CDPの運用データベースには、次のコンポーネントがあります。

    • Apache Phoenixは、ApacheHBase上で実行されるSQLインターフェースです。
    • Apache HBaseは大規模なスケーラビリティを実現するように設計されているため、単一のプラットフォームに無制限の量のデータを保存し、データを提供するための高まる需要に対応できます。
    • Apache ZooKeeperは、分散構成サービス、同期サービス、およびネーミングレジストリを提供します。
    • Apache Knox Gatewayは境界セキュリティを提供するため、企業は自信を持って新しいユーザーにアクセスを拡張できます。
    • Apache HDFSは、ApacheHBaseWALの作成に使用されます。
    • AmazonS3やMicrosoftADLSGen2などのオブジェクトストアは、ApacheHBaseHFilesを保存するために使用されます。
    • 共有データエクスペリエンス(SDX)は、セキュリティおよびガバナンス機能に使用されます。セキュリティとガバナンスのポリシーは一度設定され、すべてのデータとワークロードに適用されます。
    • IDBrokerは、ApacheKnoxの認証サービスの一部として構築されたRESTAPIです。これにより、認証および承認されたユーザーは、一連の資格情報またはトークンをクラウドベンダーのアクセストークンと交換できます。

    CDPシリーズの運用データベース

    この記事では、CDP上のOpDBとそのアーキテクチャについて紹介しました。 OpDBの各側面について詳しく学び、このシリーズの今後の記事でOpDBの新機能について知ることができます。各ブログ投稿へのリンクは、公開され次第更新します。

    アクセシビリティ

    ClouderaのOpDBは、ユーザーが保存されたデータにアクセスまたは取得できるようにします。自動シャーディングと事前定義されたシャーディングの両方、3つのクエリエンジン、およびいくつかのデータ統合ツールをサポートします。この記事では、これらの機能と、高レベルのアクセシビリティを実現するためのその他の機能の概要を説明します。

    管理

    ClouderaのOpDBは、OpDBワークロードを管理するためのいくつかの管理ツールと機能を提供します。管理者は、OpDBをCDP Public Cloud – Data Hubの完全に安全なセミマネージドオファリングとして、およびCDPデータセンターの完全にカスタマイズ可能なオファリング(CDHおよびHDPで利用可能なものと同様)として展開できます。この記事では、CDPでOpDBを管理するためにサポートされている機能とツールの概要を説明します。

    管理

    ClouderaのOpDBは、OpDBワークロードを効果的に管理するのに役立つ管理ツールを提供します。この記事では、CDPのOpDB管理ツールと機能の概要を説明します。

    可用性

    ClouderaのOpDBは、高レベルのデータ可用性を維持し、ノード障害が発生した場合でも、必要なときに必要な場所で必要なデータにアクセスできるようにします。この記事では、すぐに使用できる高可用性、データレプリケーション、エラー保護など、高レベルの可用性を可能にする機能の概要を説明します。

    完全性

    ClouderaのOpDBは、エンティティとドメインの整合性、ACIDトランザクション、非リレーショナル整合性など、さまざまなデータ整合性機能を提供します。この記事では、OpDBデータ整合性機能の概要を説明します。

    アプリケーションサポート

    ClouderaのOpDBは、OpDBに保存されているデータにアクセスするために使用できるさまざまな一般的な言語、フレームワーク、およびアプリケーションをサポートしています。この記事では、サポートされている言語、フレームワーク、およびアプリケーションの概要を説明します。

    NoSQLおよび関連機能

    ClouderaのOpDBには、データを格納するためのNoSQLデータベースHBaseが含まれているため、キー値、テーブルスタイル機能、柔軟なデータ型などのNoSQL機能を備えています。 HDFS、Spark、Kafkaなど、Hadoopエコシステム全体の緊密な統合も提供されます。この記事では、これらの機能の概要を説明します。

    スケーラビリティ

    ClouderaのOpDBは、高いスケーラビリティを実現するように設計されており、柔軟なデータ型とデータサイズの制限なしで、垂直方向と水平方向の両方のスケーラビリティをサポートします。この記事では、サポートされているスケーラビリティ関連の機能とツールの概要を説明します。

    セキュリティ

    ClouderaのOpDBは、暗号化、認証、承認、監査に関して、さまざまなレベルで複数のセキュリティソリューションを提供します。この記事では、これらのセキュリティ関連の機能とツールの概要を説明します。

    詳細については、「オペレーショナルデータベース入門」を参照してください。


    1. UbuntuからmongoDBをアンインストールします

    2. 範囲ベースのページングmongodb

    3. TwitterのストリーミングAPIからツイートを消費してmongodbに保存するにはどうすればよいですか?

    4. Redisを使用した通知およびニュースエリア