sql >> データベース >  >> NoSQL >> HBase

HDFSの上位6つの機能–HadoopHDFSチュートリアル

    以前のブログでは、 Hadoop HDFSについて学びました。 詳細については、このブログで、HDFSの機能について説明します。 Hadoop HDFSには、フォールトトレランス、レプリケーション、信頼性、高可用性、分散ストレージ、スケーラビリティなどの機能があります。

    HadoopのHDFSのこれらすべての機能については、このHadoopHDFSチュートリアルで説明します。

    HadoopHDFSの概要

    Hadoop分散ファイルシステム(HDFS) Hadoopのプライマリストレージシステムです。コモディティハードウェアのクラスターで実行されている非常に大きなファイルを格納します。 HDFSはGFS(Google FileSystem)に基づいています。ハードウェア障害が発生した場合でもデータを確実に保存します。

    HDFSは、並行してアクセスすることにより、アプリケーションへの高スループットアクセスも提供します。 2017年末までの予測によると、地球上で利用可能なデータの75%がHDFSに存在することになります。

    HDFSの6つの重要な機能

    Hadoop HDFSの紹介を学習した後、HDFSの最も重要な機能について説明しましょう。

    1。フォールトトレランス

    Hadoop HDFSのフォールトトレランスは、不利な状況でのシステムの動作強度です。フォールトトレラント性が高いです。 Hadoopフレームワークは、データをブロックに分割します。その後、クラスター内の異なるマシン上にブロックの複数のコピーを作成します。

    したがって、クラスター内のいずれかのマシンがダウンした場合、クライアントは、データブロックの同じコピーを含む他のマシンからデータに簡単にアクセスできます。

    2。高可用性

    Hadoop HDFSは、可用性の高いファイルシステムです。 HDFSでは、HDFSクラスターに存在する他のスレーブにブロックのレプリカを作成することで、Hadoopクラスター内のノード間でデータが複製されます。したがって、ユーザーがこのデータにアクセスしたいときはいつでも、そのブロックを含むスレーブから自分のデータにアクセスできます。

    ノードの障害などの好ましくない状況では、ユーザーは他のノードから自分のデータに簡単にアクセスできます。ブロックの重複コピーがHDFSクラスター内の他のノードに存在するためです。

    3。高い信頼性

    HDFSは信頼性の高いデータストレージを提供します。数百ペタバイトの範囲のデータを保存できます。 HDFSは、データをクラスターに確実に保存します。データをブロックに分割します。 Hadoopフレームワークは、これらのブロックをHDFSクラスターに存在するノードに保存します。

    HDFSは、クラスター内に存在するすべてのブロックのレプリカを作成することにより、データを確実に保存します。したがって、フォールトトレランス機能を提供します。データを含むクラスター内のノードがダウンした場合、ユーザーは他のノードからそのデータに簡単にアクセスできます。

    HDFSはデフォルトで、ノードに存在するデータを含む各ブロックの3つのレプリカを作成します。そのため、ユーザーはデータをすぐに利用できます。したがって、ユーザーはデータ損失の問題に直面しません。したがって、HDFSは信頼性が高いです。

    4。レプリケーション

    データレプリケーションは、HDFSのユニークな機能です。レプリケーションは、ハードウェア障害、ノードのクラッシュなどの好ましくない状態でのデータ損失の問題を解決します。HDFSは、定期的な間隔でレプリケーションのプロセスを維持します。

    HDFSは、クラスター内に存在するさまざまなマシン上にユーザーデータのレプリカを作成し続けます。したがって、いずれかのノードがダウンした場合、ユーザーは他のマシンからデータにアクセスできます。したがって、ユーザーデータが失われる可能性はありません。

    5。スケーラビリティ

    Hadoop HDFSは、クラスター内の複数のノードにデータを保存します。したがって、要件が増えるたびに、クラスターをスケーリングできます。 HDFSでは、次の2つのスケーラビリティメカニズムを使用できます。垂直 および水平スケーラビリティ。

    6。分散ストレージ

    HDFSのすべての機能は、分散ストレージとレプリケーションを介して実現されます。 HDFSは、ノード間で分散された方法でデータを保存します。 Hadoopでは、データはブロックに分割され、HDFSクラスターに存在するノードに保存されます。

    その後、HDFSはすべてのブロックのレプリカを作成し、他のノードに保存します。クラスタ内の1台のマシンがクラッシュした場合、そのレプリカを含む他のノードからデータに簡単にアクセスできます。

    結論

    結論として、HDFSはフォールトトレラント性が高いと言えます。ハードウェア障害があっても、大量のデータを確実に保存します。また、高いスケーラビリティと高可用性を提供します。したがって、HDFSはHadoop機能を強化します。 HDFSの他の機能を見つけた場合は、下のコメントセクションで共有してください。


    1. Dockerコンテナのディスク使用量を分析する方法

    2. 地理空間情報をmongoDBに保存する方法

    3. 接続ごとに新しいRedisクライアントを作成する必要がありますか?

    4. Mongoは、単一のクエリで一致するドキュメントフィールドを一括検索して更新しますか?