ビッグデータ
ビッグデータ 構造化または非構造化のいずれかで、日常的にビジネスに氾濫する大量のデータについて説明します。ビッグデータは、通常のデータ処理ソフトウェアでは処理できないほど大きいまたは複雑なデータセットを分析、情報抽出、または処理する方法を扱います。
ビッグデータには次の特徴があります。
- ボリューム: 生成および保存されたデータの量
- バラエティ: データの種類と性質
- 速度: データが生成および処理される速度
- 速度: データ品質とデータ値
ビッグデータに対するAzureの影響
Microsoft Azureは、機械学習ツールを使用して、データを実用的な洞察に変換します。あらゆるデータをあらゆる規模で組み合わせ、機械学習モデルを大規模に構築して展開することができます。
次のAzure製品を使用すると、ビッグデータに対して高度な分析を実行できます。
- SQLデータウェアハウス
- データファクトリ
- AzureBLOBストレージ
- Azure Databricks
- Azure Cosmos DB
- Power BI
それぞれを個別に見てみましょう。
SQLデータウェアハウス
SQLデータウェアハウスはクラウドベースのEDW(エンタープライズデータウェアハウス)であり、超並列処理(一連の計算を並列に実行する多数のプロセッサ)を使用して、ペタバイト単位のデータにわたって複雑なクエリを実行します。
PolyBase T-SQLクエリ(Hadoopからデータを読み取るクエリ)を使用してビッグデータをSQLデータウェアハウスにインポートし、MPPの機能を使用して高性能分析を実行するだけです。データウェアハウスは、洞察を得るために信頼できる唯一の真実になります。
データファクトリ
Data Factoryは、データストレージ、移動、および処理サービスを自動化されたデータパイプラインに構成するクラウドデータ統合サービスです。 Azure Data Factoryは、ETL / ELT(抽出、変換、読み込み)ワークフローを作成、スケジュール、および調整できるハイブリッドデータ統合サービスです。
AzureBLOBストレージ
Azure BLOBストレージは、非構造化ドキュメント、画像、ビデオ、およびオーディオ用の非常にスケーラブルなオブジェクトストレージです。 Azure BLOBストレージは、テキストやバイナリデータなど、大量の非構造化データ(特定のデータモデルや定義に準拠していないデータ)を格納するために最適化されています。
AzureBLOBストレージには次の機能があります。
- ドキュメントや画像をブラウザに直接提供する
- 分散アクセス用のファイルの保存
- オーディオとビデオのストリーミング
- ログファイルへの書き込み
- ディザスタリカバリ、バックアップと復元、およびアーカイブのためのデータの保存
Azure Databricks
Azure Databricksは、簡単で高速な、協調的なApache Sparkベースの(暗黙的なデータ並列処理を使用してクラスターをプログラミングするためのインターフェイスを提供するオープンソースの分散型汎用クラスターコンピューティングフレームワーク)分析プラットフォームです。
Azure Cosmos DB
Azure Cosmos DBは、グローバルに分散されたデータベースサービスです。低遅延、スループットの弾力性のあるスケーラビリティ、データの一貫性のための明確に定義されたセマンティクス、および高可用性を提供するように設計されています。
Power BI
Power BIは、洞察を提供するビジネス分析ツールのスイートです。 Power BIを使用すると、多数のデータソースに接続し、データの準備を簡素化し、アドホック分析を推進し、Webやモバイルデバイス間で使用するレポートを作成できます。
結論
ビッグデータは進化し続けています。 Azureツールの助けを借りて、ビッグデータはますます管理しやすくなります。