sql >> データベース >  >> RDS >> Database

ScyllaDBトレンド–ユーザーがリアルタイムビッグデータデータベースを展開する方法

    ScyllaDBは、人気のあるApacheCassandraデータベースから再実装されたオープンソースの分散型NoSQLデータストアです。 DB-Enginesによると、わずか4年前の2015年にリリースされたScyllaの人気は、平均して前年比で220%以上増加しています。 DBAコミュニティとユーザーからこの新しいデータベースについて多くのことを聞いており、ユーザーからの展開の傾向について詳しく知るために、今年のScyllaサミットのスポンサーになることを決定しました。この投稿では、ScyllaDBクラウドとオンプレミスの展開、最も人気のあるクラウドプロバイダー、ScyllaDBで使用されるSQLおよびNoSQLデータベース、最も時間のかかる管理タスク、およびScyllaDBとCassandraを使用する理由について説明します。

    • ScyllaDBとCassandra
    • ScyllaDBクラウドとScyllaDBオンプレミス
    • ScyllaDBで最も人気のあるクラウドプロバイダー
    • ScyllaDBで最も一般的に使用されるデータベース
    • ほとんどの時間-ScyllaDB管理タスクの消費

    ScyllaDBとCassandra–どちらが良いですか?

    展開に使用するワイドカラムストアを検討していますか? Cassandraは依然として最も人気がありますが、DB-Enginesによると、ScyllaDBは7番目に人気のあるワイドカラムストアとして急速に成長しています。では、ユーザーがScyllaDBとCassandraを選ぶ理由は何ですか?

    ScyllaDBは大幅に低いレイテンシーを提供し、最小限の遅延で大量のデータを処理できるようにします。実際、ScyllaDBのパフォーマンスベンチマークレポートによると、99.9パーセンタイルのレイテンシは、AWSEC2ベアメタルのCassandraよりも最大11倍優れています。ですから、この種のパフォーマンスにはコストがかかりますよね?確かにそうですが、このレポートでは、ノードの10%でこのパフォーマンスを達成できるため、Cassandraを実行する場合と比較して2.5倍のコスト削減になると主張しています。

    ScyllaDBとCassandraには数十の質の高い記事があるので、ここで短くして、この記事の本当の目的に到達し、ScyllaDBのユーザーデータを分析できるようにします。 。

    ScyllaDBクラウドとScyllaDBオンプレミス

    ScyllaDBは、パブリッククラウドとオンプレミスの両方で実行できます。実際、ScyllaDBは、単一の組織内のパブリッククラウド環境とオンプレミス環境の両方で最も一般的に展開されています。クラウドとオンプレミスの両方のコンピューティングを活用するScyllaDB展開の44%は、特定のアプリケーションに両方を活用するハイブリッドクラウド環境、またはこれらの環境を個別に使用してさまざまなアプリケーションを管理することのいずれかを介して行うことができます。

    ScyllaDBオンプレミス展開とScyllaDBクラウド展開は、それぞれ28%でさえ死んでいました。無料のオープンソースScyllaDBとScyllaDBEnterpriseの両方をクラウドまたはオンプレミスで実行でき、ScyllaDBEnterpriseライセンスは年間$28.8kから始まり、合計48コアになります。

    #ScyllaDBを展開するための最良の方法は何ですか?クラウドvs.オンプレミスクリックしてツイート

    ScyllaDBで最も人気のあるクラウドプロバイダー

    ScyllaDBクラスターの28%がクラウドに排他的にデプロイされ、72%がある程度の容量でクラウドを使用しているため、ScyllaDBワークロードで最も人気のあるクラウドプロバイダーを確認することに関心がありました。 。

    #1。 AWS

    調査参加者によると、すべてのScyllaDBクラウドデプロイメントの39.1%がAWSで実行されていることがわかりました。 AWSがScyllaDBのナンバーワンのクラウドプロバイダーであると期待していましたが、その割合は、55%がAWSにデプロイされていると報告したこの調査のすべてのクラウドデータベースタイプからの回答よりもかなり低かった。この数値は、クラウド展開の56.9%がAWSで実行されていると報告された最近の2019 Open Source DatabaseTrendsReportとより一致しています。これは、AWSがリレーショナルデータベースサービス(RDS)を介してScyllaDBをサポートしていないことが原因である可能性があります。そのため、より多くの組織がデータをScyllaDBに移行し続けると、AWSの顧客ベースが減少する可能性があると推測できます。

    #2。 Google Cloud

    Google Cloud Platform(GCP)は、ScyllaDBで2番目に人気のあるクラウドプロバイダーであり、すべてのクラウド展開の30.4%を占めています。 Google Cloudは、独自のワイドカラムストアとBigtableと呼ばれるビッグデータデータベースを提供しています。これは、DB-EnginesのScyllaDBの110位で実際に111位にランクされています。 ScyllaDBの低コストと高性能の機能は、特にGCPでのみ市販されているBigtableと比較してオープンソースであるため、GCPユーザーにとって魅力的なオプションです。

    #3。 Azure

    Azureは、調査回答者によるクラウド内のすべてのScyllaDB展開の17.4%を占める3位に続きました。 Azureは、Microsoftの一連のサービスを活用する組織にとって魅力的なクラウドプロバイダーです。

    #ScyllaDBで最も人気のあるクラウドプロバイダーはどれですか? AWS vs. Azure vs. GCPClick To Tweet

    ScyllaDBクラウド展開の残りの13.0%は、DigitalOcean、Alibaba、およびTencentクラウドコンピューティングサービスで実行されていることがわかりました。

    現在、マネージドサービスであるScylla CloudはAWSでのみ利用可能であり、DBaaSを活用するにはScyllaDBEnterpriseバージョンを使用する必要があります。 Scylla Cloudは、将来的にGCPとAzureのサポートを追加する予定ですが、AWSに関するレポートは39%しかないため、ScyllaDBのデプロイの60%以上がクラウドで自己管理されていると想定できます。

    ScyllaDBで最も一般的に使用されるデータベース

    2019年のオープンソースデータベースレポートからもわかるように、組織は平均して3.1種類のデータベースを活用しています。ただし、この調査では、ScyllaDBを使用している組織は、平均で2.3の異なるデータベースタイプのみを使用していると報告しました。これは、すべてのオープンソースデータベースユーザーの結果と比較して26%の削減です。また、ScyllaDBデプロイメントの39%がScyllaDBのみを使用しており、アプリケーションで他のデータベースタイプを利用していないこともわかりました。

    では、ScyllaDBと組み合わせて最も一般的に使用されるデータベースはどれですか。 ScyllaDBユーザーもSQLデータベースMySQLを20%使用しており、PostgreSQLも20%使用していることがわかりました。 ScyllaDBで2番目に一般的に使用されるデータベースは、展開の16%で表されるCassandraでした。これは、両方のデータベースタイプがワイド列ストアであるため、アプリケーションでCassandraの代わりにScyllaDBをテストしている組織によるものと推測できます。

    MongoDBは、ScyllaDBが12%で、4番目に多くデプロイされたデータベースでした。 RedisとElasticsearchは5位で結ばれ、どちらもScyllaDBの導入で8%の確率で活用されています。

    また、Scyllaデプロイメントの20%が、Oracle、Aerospike、Kafka(現在、イベントストリーミングデータベースに変換中)、DB2、Tarantoolなどの他のデータベースタイプを活用していることもわかりました。

    ほとんどの時間-ScyllaDB管理タスクの消費

    ScyllaDBは非常に強力ですが、使い方はどれほど簡単ですか。 ScyllaDBユーザーに最も時間のかかる管理タスクを尋ねたところ、28%から、Scyllaの修復が最も長い管理タスクであると聞きました。 Scylla Repairは、バックグラウンドで実行される同期プロセスであり、すべてのレプリカが最終的に同じデータを保持するようにします。 ScyllaDBオープンソースまたはScyllaDBEnterpriseバージョンでは修復を自動化する方法がないため、ユーザーは定期的にnodetool repairコマンドを実行する必要がありますが、ScyllaManagerを使用して修復スケジュールを設定できます。

    ScyllaDBの低速クエリ分析は、最も時間のかかる管理タスクで、ScyllaDBのバックアップとリカバリをそれぞれ14%で2位に結び付けました。 ScyllaDBには現在、最適化が必要なクエリを識別するために使用できるクエリアナライザがないようですが、ユーザーはSlow Query Loggingを使用して、応答時間が最も長いクエリを確認できます。 ScyllaDBのバックアップも、オープンソースバージョンとエンタープライズバージョンでは自動化できませんが、ScyllaManagerの将来のエディションで定期的なバックアップが利用可能になると述べています。また、ScyllaDBバックアップを復元する自動化された方法はありません。これらは、すべてのバージョンで手動で実行する必要があるためです。

    ScyllaDBユーザーの10%が、ノードの追加、削除、または交換が最も時間のかかる作業であり、4位に入ったと報告しています。これらは手動プロセスであり、特に大きなデータサイズを処理している場合は、かなりの時間がかかる可能性があります。ノードを追加すると、デプロイメントがスケールアウトされ、ノードを削除すると、デプロイメントがスケールダウンされます。ノードがダウンしているか停止している場合は、ノードを交換する必要がありますが、複数のノードがダウンしている場合でもクラスターを使用できます。

    7%で5位にランクインしたのは、アップグレードとトラブルシューティングでした。 ScyllaDB Enterpriseとオープンソースはどちらも、クラスターをアップグレードするための広範な手順を必要とします。推奨される方法はローリング手順によるため、ダウンタイムは発生しませんが、これは手動プロセスであるため、ユーザーは一度に1つのノードを停止し、すべてのアップグレード手順を実行し、ノードを再起動して検証してから、クラスタ内の残りのノードについても同じ手順です。確かに時間がかかりますが、幸いなことに毎日の作業ではありません!トラブルシューティングはもちろん、掘り下げるための深いうさぎの穴ですが、ScyllaDB Enterpriseのお客様は、24時間年中無休のミッションクリティカルなサポートを受け、オープンソースユーザーは、ドキュメント、メーリングリスト、Scylla大学、ユーザー向けのSlackチャネルなどの多数のリソースにアクセスできます。ディスカッション。

    最も時間のかかる#ScyllaDB管理タスクは何ですか?クリックしてツイート

    ScyllaDBユーザーによって報告された時間のかかるタスクの残りの21%には、監視、移行、プロビジョニング、シャードのバランス調整、圧縮、パッチ適用が含まれます。

    では、これらの結果はScyllaDBの展開とどのように比較されますか?これらの時間のかかる管理タスクを自動化する方法をお探しですか?現在、MySQL、PostgreSQL、Redis™*、MongoDB®データベースをサポートしていますが、DBaaSプランを通じて、次にサポートを追加するデータベースに関するフィードバックを常に探しています。クラウドまたはオンプレミスでScyllaDBクラスターを管理する簡単な方法をお探しの場合は、コメントまたはTwitter(@scalegridio)でお知らせください。


    1. Django + Psycopg2:InterfaceError:プロトコル3のみがサポートされています

    2. SQL Server 2016:ストアドプロシージャを作成する

    3. make_interval()がPostgreSQLでどのように機能するか

    4. ORA-00936:式oracleがありません