Apache Phoenix for CDH:DBMSの最高の新機能
Clouderaは、CDH用のApache Phoenixを採用しており、今後もClouderaDataPlatform用に統合する予定です。
ClouderaのCDHリリースには、ビッグデータの力を活用したい顧客の運用アプリケーションに復元力のあるNoSQLDBMSを提供するApacheHBaseが含まれています。これらのアプリケーションは、トップラインの収益とボトムラインの収益性を促進するミッションクリティカルおよびミッションクリティカルなアプリケーションに成長しました。これらのアプリケーションには、顧客向けアプリケーション、eコマースプラットフォーム、銀行の舞台裏で使用されるリスクと不正の検出、またはアプリケーションのAI / MLモデルの提供が含まれ、実際の結果に基づいて同じもののさらなる強化トレーニングを可能にします。
ただし、多くのお客様にとって、HBaseは非常に困難な道のりであり、学習する必要があります
- HBaseとしての新しいデータモデルは、数百万の列をサポートするワイドテーブルスキーマですが、結合はサポートされていません。
- ANSISQLの代わりにJavaAPIを使用する
彼らは、OracleやMySQLによって提供されるものに似た、より伝統的なスキーマ設計を使用できるようにすることを求めており、柔軟性に関していくつかのトレードオフを進んで行っています。たとえば、
- 独自のデータ型を定義する代わりに、提供されたデータ型を使用することをいとわない
- 単一の行の単一のタイプと引き換えに、行に応じて単一の列に複数のタイプを持たせる柔軟性を放棄することをいとわない
RDBMSのような機能(ANSI SQL、単純な結合、ボックスなど)、CDHでのApachePhoenixのサポートを導入しています。
他のすべての人にとって、Phoenixベースのアプリケーションは舞台裏のHBase最適化の恩恵も受けており、HBaseのパフォーマンスを向上させるのが容易になっています。たとえば、Phoenixは主キーのソルティングを実装しているため、HBaseユーザーはキー設計のこの側面について考える必要がありません。
さらに、PhoenixベースのアプリケーションはHBaseアプリケーションと共存できます。つまり、単一のHBaseクラスターを使用して両方をサポートできます。フェニックスを使用すると、顧客は、過去にHive&Impalaで使用したのと同じように、お気に入りのBIおよびダッシュボードツールを引き続き使用できます。フェニックスを使用する場合、Hive / Impalaを使用するオプションに加えて、これらのツールでフェニックスを直接使用することを選択することもできます。これにより、新しい実装の手順が不要になります。
セキュリティとガバナンスの観点(SDX)から、CDHでは、PhoenixはHBaseACLを使用してPhoenixテーブルのロールベースのアクセス制御を行います。フェニックスはまた、監査情報のためにClouderaNavigatorへのHBase統合を使用しています。
Clouderaは、CDH5.16.2のお客様が利用できるPhoenix4.14.1の小包と、CDH6.2以降のお客様が利用できるPhoenix5.0の小包をリリースしました。
既存のHDPのお客様はすでにApachePhoenixをサポートしており、HDPを使用しているHBaseユーザーのほぼ半数が現在Phoenixを使用しており、HBaseユーザーコミュニティでの人気についても語っています。
CDH用のApachePhoenixをダウンロード
ApachePhoenixを使用してミッションクリティカルなアプリケーションを構築します。こちらからソフトウェアをダウンロードしてください。
フェニックスに関するよくある質問
Q)フェニックスを使用する必要があるワークロードは何ですか
Phoenixは、HBaseと同じユースケース、主に低レイテンシー、高同時実行性のワークロードをサポートします。ただし、Phoenixを使用すると、ダッシュボードとBIの目的で基盤となるデータを活用することも簡単になります
Q)フェニックスの承認メカニズムとは何ですか?
フェニックスは承認をHBaseに依存しています。 CDHのお客様の場合、これはHBaseACLを利用します。 HDPのお客様の場合、これはHBaseとRangerの統合によるものです
Q)フェニックスのスケーラビリティはどれくらいですか?既知の最大のクラスターは何ですか?
フェニックスは数百TBのデータに拡張できます。最大の顧客は、Phoenixによって管理されている0.5PBを超えるデータを持っています。ユースケースの詳細は、PhoenixConアーカイブと、今年初めのNoSQLデイビデオのアーカイブにユーザー自身の言葉とスライドで記載されています。
Q)フェニックスは地理空間セカンダリインデックスをサポートしていますか?どのレベルのサポート空間データですか?
地理空間データのサポートは制限されています。ただし、GeoMesaは、このニーズをサポートし、顧客のアプリケーションと統合できる地理空間レイヤーをHBaseに提供します。 Phoenix、GeoMesa、JanusGraph、OpenTSDBはすべて、単一のHBaseクラスターに共存できます。
Q)インデックスをどのように作成して使用しますか?
インデックス作成の詳細については、Phoenixのセカンダリインデックス作成ページをご覧ください。 Phoenix 4.8.0以降では、ローカルインデックスを使用するために構成を変更する必要はありません。
Q)インデックスに登録できる列の数に制限はありますか?
RDBMSと同様に、インデックスは基本的に、インデックスとソースデータへのリンクを備えた別個のテーブルです。すべての列にインデックスを付けると、2つの同一のテーブルを維持することで目的を達成できなくなります。書き込み(グローバルインデックス)または読み取り(ローカルインデックス)には重要なオーバーヘッドがあるため、インデックスは慎重に使用する必要があります。