時間とテクノロジーは加速し続けており、保存したデータは指数関数的に増加し続けています。したがって、Very Large Database(VLDB)の正確な定義は、ハードウェアとソフトウェアの新しい進歩に伴って変化し続けています。ただし、VLDBを新しいタブレット、またはラップトップに取り付けることは、通常、少なくともまだ行われることはありません。
非常に大規模なデータベースの規模はどれくらいですか?
多くの技術当局は、VLDBを構成するものの実際の出発点について議論しています。 100ギガバイト以上のデータベースと言う人もいます。 VLDBのサイズは少なくとも1テラバイト(1000GB)であると主張する人もいます。また、サポートできる複雑なクエリとトランザクションの数と種類によっても測定できます。ただし、正確な量に関係なく、VLDBには膨大な量の情報が含まれており、非常に多くのタプル(データベース行)に分散されており、物理ファイルシステムの大容量のストレージスペースを占有していると言っても過言ではありません。
VLDBのサイズが非常に大きいため、より多くの作業が必要な場合は、VLDBを扱っていることがわかります。妥当な時間内にデータベースをバックアップできないこと、およびテスト目的でDBを複製する際の経済的制約は、対処しなければならない問題のほんの一部です。
VLDBを使用するのは誰ですか?
地方自治体、政府の防衛請負業者、調査会社、金融業界の大企業など、多くの企業や組織がVLDBを利用しています。 VLDBを定期的に活用して戦略的優位性を確保している代表的な例は、完全に独立した欧州研究グループであるTACです。これは、金融投資家、産業企業、多国間組織に国際的な経済および金融問題に関する助言サービスを提供しています。 TACは、主に自社の内部使用のためにVLDBを構築しますが、一部は、外国投資と開発目標を監視する分析目的で一般に公開されています。
他の企業は、データ比較、データマイニング、データウェアハウジング、複製、クエリ、デモンストレーション、および多数の追加機能にVLDBを使用しています。テクノロジートレンドウォッチャーは彼らと一緒に監視します。 IT管理者は、彼らと一緒に設計および開発します。研究開発の専門家とイノベーションユニットは、彼らと一緒に統計を追跡します。また、VLDBは、ワールドワイドウェブ上の個人情報の需要においてますます重要な役割を果たしています。
では、非常に大規模なデータベースをどのように管理しますか?
David vs. Goliathの話は、データベースがテラバイトに近づいていることに人々が気付いたときによく思い浮かびます。スペースの割り当てとクエリの高速化はますます困難になっています。そのため、スペースを再利用してパフォーマンスを向上させるという、一見克服できないタスクを、その巨人を征服するためのノウハウと技術ツールを備えた専門家に割り当てる必要があります。
VLDBは、適切なタイプのデータベース管理システム(DBMS)によって効果的に制御できます。つまり、データベースとエンドユーザー間のインターフェイスを提供し、データの作成、クエリ、更新、および管理を可能にする、特別に設計されたコンピューターソフトウェア(またはソフトウェアスイート)です。また、DBMSは、保存されたデータのセキュリティと整合性を維持し、システムに障害が発生した場合の情報の回復を容易にします。また、DBMSにはさまざまな種類がありますが、その論文は別のブログ用に別の機会に保存します。
ほとんどのデータベース管理システムの開発は非常に複雑で時間がかかり、コンピュータのメモリ、ストレージ、プロセッサ、およびネットワークの進歩に伴う継続的なアップグレードが必要です。ソフトウェア開発者が最新のデータ量の増加の要求に対応しようと努めているため、データベースのサイズ、範囲、およびパフォーマンスは増加し続けています。 21世紀のほとんどの生活と同様に、私たちは非常に速く長い道のりを歩んできました。それを証明するデータがあります!