sql >> データベース >  >> RDS >> Database

RowGenv3はデータベーステストデータの生成を自動化します

    DBAにとっての優れたテストデータの価値はよく知られています:

    「データベースを多用するアプリケーションのテストには、隠れた依存関係、データセマンティクスの微妙な違い、ターゲットデータベーススキーム、暗黙のビジネスルールに起因する固有の課題があります。アプリケーションに統合された異種データベースまたは機密データが含まれる場合、これらの課題はさらに困難になります。実際のデータの問題をシミュレートする適切なテストデータは、機能入力の妥当な品質ベンチマーク(検証、負荷、パフォーマンス、およびストレステスト)を達成するために重要です。 」– Ali Raza&Stephen Clyde、リレーショナルデータベースをテストするためのデータセットの作成からの要約

    データベース操作のテスト、データウェアハウスとETL / ELTジョブのプロトタイピング、ファイルサンプルとレポートの安全なアウトソーシング、DBアプライアンスでのパフォーマンスベンチマークの実行にはすべて、本番データベースのルックアンドフィールを備えたテストデータが必要です。後で実際のデータで正常に実行します。 RazaとClydeは、2012年の本で、テストデータの生成とテストデータの抽出を比較しています。

    IRIとそのユーザーは、テストに実際のデータを使用することは望ましくないことを知っています。今日の最も明白な理由は、実際のデータが、機密を保持する必要のある個人情報(PII)を公開するリスクがあることです。開発者またはテスターは、このフェーズでプロセスを実行したり、データベースシステムをテストしたりして、社会保障番号、クレジットカード情報、生年月日などの顧客情報を共有するリスクを冒したくありません。現在利用可能な実際のデータは、より大きなボリュームや値の範囲を処理する必要があるアプリケーションやデータベースのストレステストを行うのに十分な堅牢性や現実性を備えていない場合もあります。

    残念ながら、RazaとClydeは、RowGen v3がリリースされる前に本を書きましたが、それが次のようなテストデータを生成することを観察した可能性があります。

    1)新しいまたはランダム化された実際の列値が含まれているためPIIを公開しません
    2)元のDDLで定義された構造的および参照整合性を維持します
    3)元のデータベースのデータボリュームに限定されません。値の範囲
    4)複雑な要件に対応するために、スクリプトの生成を通じてカスタマイズできます
    5)事前に並べ替えられ、可能な限り最速の人口のために自動的にバルクロードされます
    6)バッチで定義されます多様な柔軟性があり、必要に応じてエクスポート、再利用、変更できるスクリプト

    IRI RowGen v3は、リレーショナルデータベース向けの世界最速かつ最も堅牢な大量テストデータジェネレータの最新リリースです。 RowGenは、Eclipse上に構築されたIRI Workbench GUI、コマンドライン、またはバッチプログラムから実行され、本番データベース内のスコープ、レイアウト、および関係を正確に反映するために必要なテストデータの品質と量を生成します。データウェアハウスと運用データストア。

    RowGenv3の新しいDBテストデータウィザードは、IRI Workbench GUIから起動すると、次の仕様と自動化についてユーザーをガイドします。

    解析 –入力するスキーマとテーブルを選択することにより、RowGenは、データベーステーブルの説明と整合性制約を、ソース構造、依存セット、およびデータ作成を、正しい形式でテーブルに入力するために必要な順序で指定する.rclスクリプトに変換します。すべての主キー、一意のインデックス、および外部キーの関係が尊重されます。

    生成 – .rclスクリプトを作成して実行し、テーブルごとに1つのテストファイルを作成して、一括ロードしたり、将来使用するために保存したりできます。

    人口 –構造的および参照的に正しい事前にソートされたテストデータを使用して、ターゲットテーブルを正しい順序で一括ロードする。

    このプロセスは、巨大なテストデータベースを迅速にロードし、ビジネスルールとデータプライバシー法の両方に準拠することができます。生成されたデータは、データベース操作とクエリアプリケーションのストレステストを行うのに十分なほど現実的で堅牢です。

    RowGen v3は、ルールベースおよびスクリプトベースのオプションもサポートしており、特定のデータベースの制約に対応し、本番環境でのデータの出現率と発生率を最もよく表す特定のフィールド値と値の範囲の分布を制御します。ユーザーは、テスト値が線形、正規化、加重、または標準の分布に準拠していることをグラフ化して視覚的に実証することもできます。

    RowGen v3の詳細については、www.iri.com / products / rowgen、www.iri.com / products / rowgen / guiを参照するか、IRIブログのテストデータセクションにある他の記事をお読みください。


    1. RMANおよびORA-00245を使用したスナップショット制御ファイル機能

    2. PostgreSQLユーザーパスワードを変更するにはどうすればよいですか?

    3. PostgreSQLの間隔値「2日」を連結する方法

    4. OracleのCURRENT_DATE関数