sql >> データベース >  >> RDS >> Database

MicrosoftAzureツールを使用してビッグデータを分析する

    ビッグデータ

    ビッグデータ 構造化または非構造化のいずれかで、日常的にビジネスに氾濫する大量のデータについて説明します。ビッグデータは、通常のデータ処理ソフトウェアでは処理できないほど大きいまたは複雑なデータセットを分析、情報抽出、または処理する方法を扱います。

    ビッグデータには次の特徴があります。

    • ボリューム: 生成および保存されたデータの量
    • バラエティ: データの種類と性質
    • 速度: データが生成および処理される速度
    • 速度: データ品質とデータ値

    ビッグデータに対するAzureの影響

    Microsoft Azureは、機械学習ツールを使用して、データを実用的な洞察に変換します。あらゆるデータをあらゆる規模で組み合わせ、機械学習モデルを大規模に構築して展開することができます。

    次のAzure製品を使用すると、ビッグデータに対して高度な分析を実行できます。

    • SQLデータウェアハウス
    • データファクトリ
    • AzureBLOBストレージ
    • Azure Databricks
    • Azure Cosmos DB
    • Power BI

    それぞれを個別に見てみましょう。

    SQLデータウェアハウス

    SQLデータウェアハウスはクラウドベースのEDW(エンタープライズデータウェアハウス)であり、超並列処理(一連の計算を並列に実行する多数のプロセッサ)を使用して、ペタバイト単位のデータにわたって複雑なクエリを実行します。

    PolyBase T-SQLクエリ(Hadoopからデータを読み取るクエリ)を使用してビッグデータをSQLデータウェアハウスにインポートし、MPPの機能を使用して高性能分析を実行するだけです。データウェアハウスは、洞察を得るために信頼できる唯一の真実になります。

    データファクトリ

    Data Factoryは、データストレージ、移動、および処理サービスを自動化されたデータパイプラインに構成するクラウドデータ統合サービスです。 Azure Data Factoryは、ETL / ELT(抽出、変換、読み込み)ワークフローを作成、スケジュール、および調整できるハイブリッドデータ統合サービスです。

    AzureBLOBストレージ

    Azure BLOBストレージは、非構造化ドキュメント、画像、ビデオ、およびオーディオ用の非常にスケーラブルなオブジェクトストレージです。 Azure BLOBストレージは、テキストやバイナリデータなど、大量の非構造化データ(特定のデータモデルや定義に準拠していないデータ)を格納するために最適化されています。

    AzureBLOBストレージには次の機能があります。

    • ドキュメントや画像をブラウザに直接提供する
    • 分散アクセス用のファイルの保存
    • オーディオとビデオのストリーミング
    • ログファイルへの書き込み
    • ディザスタリカバリ、バックアップと復元、およびアーカイブのためのデータの保存

    Azure Databricks

    Azure Databricksは、簡単で高速な、協調的なApache Sparkベースの(暗黙的なデータ並列処理を使用してクラスターをプログラミングするためのインターフェイスを提供するオープンソースの分散型汎用クラスターコンピューティングフレームワーク)分析プラットフォームです。

    Azure Cosmos DB

    Azure Cosmos DBは、グローバルに分散されたデータベースサービスです。低遅延、スループットの弾力性のあるスケーラビリティ、データの一貫性のための明確に定義されたセマンティクス、および高可用性を提供するように設計されています。

    Power BI

    Power BIは、洞察を提供するビジネス分析ツールのスイートです。 Power BIを使用すると、多数のデータソースに接続し、データの準備を簡素化し、アドホック分析を推進し、Webやモバイルデバイス間で使用するレポートを作成できます。

    結論

    ビッグデータは進化し続けています。 Azureツールの助けを借りて、ビッグデータはますます管理しやすくなります。


    1. データベースと認証ユーザーからソルトされたパスワードを撤回する方法は?

    2. Oracleのテーブルのすべての制約を確認する方法

    3. MySQLにIPアドレスを保存する最も効率的な方法

    4. グループ化された文字列の集約/SQLServerのLISTAGG