sql >> データベース >  >> NoSQL >> HBase

お誕生日おめでとうApacheHBase! 10年間の回復力、安定性、パフォーマンス

    Apache HBaseは10年前にApacheのトップレベルのプロジェクトになり、Clouderaは同時にそれに貢献し始めました(2010年)。この間、ビッグデータで最大かつ最も人気のあるオープンソースツールの1つであり、最も人気のあるNoSQLデータベースの1つになりました。

    ApacheSoftwareFoundationがApacheHBaseの10周年を発表

    HBaseは、Key-ValueデータベースとワイドカラムNoSQLデータベースの両方をサポートしており、企業で広く使用されています。 Clouderaには、ミッションクリティカルなトランザクションアプリケーション、データウェアハウジング、機械学習、データエンジニアリングなど、さまざまなユースケースでClouderaを使用している500を超える顧客がいます。お客様は、その復元力(何年にもわたって100%のアプリケーション稼働時間を実現できる)、安定性、パフォーマンス、および低い運用コストのためにHBaseを選択します。 Clouderaのお客様は、HBase上に構築されたSQLベースのデータベースであるPhoenixとともに、HBase上でSQLベースのOLAPクエリを実行できるApacheImpalaやApacheHiveとともに、スタンドアロンでデプロイします。

    私は2018年からClouderaのオペレーショナルデータベースオファリングのプロダクトマネージャーを務めており、多くのお客様と会う機会がありました。お客様がHBaseを使用するさまざまな方法に絶えず感銘を受けています。ユースケースの幅は非常に広く多様であるため、セグメンテーションに反対します。多くの分析の結果、ユースケースを分類するための簡単なアプローチに行き着きました。ミッションクリティカルなアプリケーションをサポートするためにそれを使用する顧客とそうでない顧客です。ミッションクリティカルなアプリケーションは、本質的にトランザクション型である傾向があり、お客様がトップラインの収益を上げたり、運用効率を高めたりするのに役立ちます。彼らにとって、HBaseがトップラインを下回ったり、ボトムラインが影響を受けたりすると、最悪の場合、人々は死ぬ可能性があります。

    ミッションクリティカルなユースケースの例:

    • ヘルスケアソフトウェアベンダーは、HBaseを使用して数百のアプリケーションに電力を供給しています。これらのアプリケーションが失敗した場合、何らかの理由で人々が死亡する可能性があり、医療費が上昇します。このお客様は、70PBを超えるデータを含む7,000以上のノードにHBaseを導入しています。
    • 携帯電話メーカーは、HBaseを使用して、6,000以上のノードで音声アシスタントやその他の多くのユースケースを有効にしています
    • 金融メディアハウスは、HBaseを使用してプラットフォームの一部に電力を供給し、トレーダーやその他の人々が1,200以上のノードの株価の動きやトレンドなどに関連するコンテキストを理解できるようにします
    • >
    • 市場をリードするメールマーケティングプラットフォームは、最大1,000ノードでHBaseを実行します
    • 保険会社は、最大1,000ノードでHBaseを使用してすべての請求情報を保存し、ライフサイクル全体でそれらの請求を管理するために使用します
    • 図書館サービスプロバイダーは、400以上のノードでHBaseを使用して、世界中の図書館間相互貸借をサポートしています。
    • 世界的な配電会社は、400以上のノードでHBaseを使用して、700万以上のスマートメーターから読み取り値を取り込み、配電ネットワーク、電力課金アプリケーションの修理チームの自動展開を実行します機械学習モデルの継続的なトレーニングを推進します
    • 1億7000万人を超える顧客を抱えるインドネシア最大の電話会社、Telkomselは、CRMアプリケーション全体をレガシーMPPデータベースからHBaseとImpalaに移行し、1秒未満の応答時間を達成することができました。個々のユーザーのすべてのCRMクエリは、レコード、プロファイル、リチャージ、データ使用量などを呼び出します。ImpalaがHBaseにクエリを実行する利点は、JDBCを介してANSI SQL互換のインターフェイスにアクセスできるようにし、CRMの変更を最小限に抑えることです。

    ミッションクリティカルではないユースケースの例:

    • パーソナルケア製品のメーカーは、HBaseを使用して、すべての製品ブランドとマーケティング資料を管理しています。
    • 半導体メーカーは、HBaseを使用して自社製品のログファイルを保存し、分析のために他のシステムに抽出します。
    • 通信事業者は、HBaseを使用してHiveのディメンションテーブルを保存します

    HBaseが他のNoSQL製品と一線を画しているのは、オープンソースのビッグデータエコシステム全体での統合であり、これにより顧客はエンドツーエンドのエクスペリエンスを得ることができます。エッジからのデータを必要とするアプリケーションや、AI/MLモデルを大規模に提供する必要があるアプリケーションまたはそれらの任意の組み合わせに使用できます。

    Clouderaで遭遇した最も興味深いサポートチケットの1つは、HBaseの顧客が、ミッションクリティカルな展開がダウンしたことを示す優先度の高いチケットを提出したときです。彼らは1年以上私たちと交流しておらず、私は彼らが重要な顧客であるとさえ知りませんでした。この場合、HBaseのオムニチャネルマーケティングプラットフォームに電力を供給するために1,000ノードをデプロイしたことを知りました。問題の根本は、インシデントの9か月前に構成設定に問題のある変更を加えたことでした。彼らが最終的に再起動したとき、問題のある構成設定が有効になり、Clouderaに助けを求めました!

    ClouderaはHBaseに深く関心を持っており、プロジェクトには15人のコミッターとPMCメンバーがいます。また、PaaSのようなフォームファクタとdbPaaSのフォームファクタの両方を使用して、パブリッククラウドで利用できるようにするための投資も行っています。

    HBaseの長年にわたる経験

    このプロジェクトに対する長年の取り組みと歴史を踏まえ、Clouderaチーム全体からこのプロジェクトに関連するいくつかの経験とストーリーを共有したいと思いました。

    「数年前、私はApacheHadoopに焦点を当てた技術会議に参加していました。ある晩遅く、私は自分の部屋に戻って歩いていました、そして私は長年の顧客として私が認識した個人のグループがテーブルの周りに群がっているのを見ました。さて、これらは私がすでに長年一緒に働いてきた非常に有能な個人のグループです。簡単に挨拶して、長い一日を過ごした後、途中にいるつもりで、私は迷いました。結局、彼らはシステムの1つで本番環境の停止が発生しており、それを解決しようとしている最中でした。私は座ってラップトップを引き出し、問題を分析して見つけた問題に対処する間、次の数時間彼らと一緒に過ごしました。ミッションクリティカルなアプリケーションをサポートするには、ヒロイックが必要な場合もありますが、途中で羽の鳥を見つけることもあります。」

    —シニアエンジニア

    「多くの企業の性質上、ミッションクリティカルなシステムの低遅延要件を拡張し、それでも満たすことができることが絶対に不可欠です。アーカイブを振り返ると、お客様はこのような困難な基準に対応するのに苦労しました。 HBaseには、特に次善のアクションをトリガーする時間を最小限に抑えることで、これらの期待に簡単に応えられるようにする要素があります。」

    —プリンシパルソリューションアーキテクト

    「3年前、私はClouderaの新しいジョイナーエンジニアリングマネージャーでした。私は会社のオープンソース活動について知っていました。高校時代からGNULinuxユーザーでしたが、オープンソースを使用することとその一部になることはまったく異なります。

    会社の新人として、私はチームが何をしているのかを理解しなければならなかったので、私は自分に割り当てられたいくつかのサポートチケットを手に入れ、それらに取り組み始めました。私は2つのことしか知りませんでした。私は長年Java開発者だったので、それができる必要があります。Hortonworksは私たちの最も挑戦的な競争相手であり、彼らと一緒に仕事をするのは面白いかもしれません。

    そして、初めてのApache HBaseチケットで、HortonworksのHBaseチームのリーダーであるJosh Elserに出くわしました。彼は、newbyタスクの実装が予想よりも難しい可能性があることを示しました(HBaseチームの品質基準では)。競合他社は、オープンソースコミュニティで最高のパートナーになることができます。結局、彼は私の変更をコミットしました。

    過去3年間で、多くのことが変化しました。 ClouderaとHortonworksが統合され、現在は同じ会社で働いていますが、ApacheとHBaseは同じです。コードに取り組む時間は限られていますが、その力を確認し、存在を知らなかったサービスにコードがどのように使用されているかを確認し、世界中の人々がどのように連携するかを確認します。企業、大陸、文化を超えて人々をつなぎます。」

    —エンジニアリングマネージャー

    「HBaseとPhoenixは簡単に習得できます。 Data Hubを使用すると、簡単に起動でき、ClouderaOperationalDatabaseがHBaseを次の10年に導くことを楽しみにしています。」

    —テクニカルカスタマーサクセスマネージャー

    「過去9年間、私はHBaseの開発の最前線から、お客様がHBaseをPOCから大規模なミッションクリティカルなプラットフォームに使用する方法の進化を見てきました。この時期の最も注目すべき瞬間は、ClouderaとHortonworksが合併する前で、両社のチームが協力して1つの重要な製品機能の機能を改善しました。最終的に、この作業はHBaseConで発表され、HBaseの最大のユーザー2人から高い評価を受けました。この機能は、世界中の20億台以上のモバイルデバイスで使用されている重要な機能を強化します。」

    –シニアエンジニア

    「HBaseの過去10年間のもう一つの素晴らしい瞬間は、HBaseCon 2015で、GoogleのCarterPageがHBaseが非常に堅実なプロジェクトにどのように進化したかを一般に認めたときでした。」

    –シニアエンジニア

    「私はほぼすべてのHBaseConに参加することができました(そしてそれらのいくつかで話すことができました)。私のお気に入りのHBaseConの思い出は次の3つです。(1)HBaseの多様性:HBase 2.0の発表では、出荷されたJIRAの数だけでなく、米国外からのHBaseコミッターとPMCメンバーの数に加えて、HBasePMCを率いる女性がいました。 、(2)HBaseの勢い:カスタムフォークを離れて100%アップストリームのApache HBaseに移行するというFacebookの発表、および(3)HBaseの足がかり:1つのHBaseConで、Bloomberg開発者が読み取りレプリカトークを行い、その後2つのHBaseConを行いました、Apple開発者は、本番環境での読み取りレプリカの使用に関するHBaseCon基調講演を行いました。」

    –シニアシステムエンジニア

    Clouderaでは、このプロジェクトの明るい未来を見続けており、PaaSのようなフォームファクターとdbPaaSフォームファクターのクラウド、およびプライベートクラウドを備えたデータセンターで構築されている次世代アプリケーションを強化するために進化することを期待しています。

    今後の予定のプレビューについては、をご覧ください。 CDPパブリッククラウドのオペレーショナルDBテンプレート


    1. MongoDB:サブドキュメントをアップサート

    2. ElasticBeanstalkでのMongosのインストール/セットアップ

    3. $slice演算子を使用して配列の最後の要素を取得する

    4. Mongodb:複数のコレクションまたはインデックス付きの1つの大きなコレクション