sql >> データベース >  >> RDS >> Database

SnowflakeDBとIRIWorkbenchを接続する

    IRI Workbench(WB)からSnowflake AWSデータベースに接続してデータを操作することは、オンプレミスのSQL互換ソースを使用する場合と同じです。スノーフレークテーブルを参照し、JDBCを介してWorkbenchでメタデータを交換します。また、ODBCを介してSortCLデータ操作プログラム(IRI VoracityおよびWorkbenchのサブセットIRI製品が使用する)との間でデータを移動します。

    IRI Workbenchを実行し、ライセンスされたIRI製品をオンプレミスまたはクラウドで実行する場所は
    あなた次第です。ただし、テーブルのボリュームがインターネット転送時間を考慮するのに十分な大きさである場合は、Snowflakeと同じノードまたはサブネットでSortCLを実行することをお勧めします。

    この記事では、次の方法を段階的に説明します。1)これらのドライバーを使用してSnowflakeにアクセスし、スキーマを確認してIRIWorkbenchでメタデータを使用します。 2)これらのテーブルのデータをSortCL互換のジョブで処理します。 Teradata、SAP HANA、EnterpriseDB(PostgreSQL)、およびODBCおよびJDBCドライバーを使用するその他のソースへの接続も同様に行われます。

    ステップ1:Snowflakeから情報とドライバーを取得する

    Snowflakeにアクセスするために必要なURL、ユーザー名とパスワード、および倉庫の名前をメモします 使用するデータベース。ドライバー構成にはこれらの詳細が必要です。

    これらの手順に従ってSnowflakeODBCドライバーをダウンロードし、これらの手順に従ってJDBCドライバーをダウンロードします。 CoSortv10SortCL実行可能ファイルおよびsnowflake-jdbc-3.6.10.jarとの互換性のために32ビットWindowsドライバーを使用しました。

    ステップ2:O/SでODBCドライバーを構成する

    私のようにWindowsインスタンスを実行している場合、およびSnowflakeの手順からわかるように、無料のMS VisualC++ランタイムも必要になります。

    Snowflakeから適切なODBCインストーラーを実行してから、ODBCデータソースアドミニストレーターでドライバーを構成します。私がここにいるように32ビットバージョンのSortCLを実行している場合は、C:\ Windows \ SysWOW64\odbcad32.exeを使用する必要があります。

    SnowflakeDISIIDriverをユーザー(またはシステム)DSNに追加します。 Snowflake Configuration Dialogで、パスワードを含む、ログインとDB/DWの詳細を次のように入力します。

    [OK]をクリックすると、このDSNを参照して、IRIWorkbenchデータ接続レジストリで参照できるようになります。しかし、最初に…

    ステップ3:IRIWorkbenchでJDBCドライバーを構成する

    最初にこれを行う必要はありませんが、アクティブなプロジェクトから作成して作業し、接続から発生するジョブとメタデータアーティファクトを保存するのが好きです。ワークスペースプロジェクトエクスプローラーにSnowflakeというフォルダーを作成しました。

    ここで、Snowflake JDBCドライバーを使用してデータソースエクスプローラーでデータベースに接続するには、最初に新しい接続プロファイルをクリックします。 アイコンをクリックし、汎用JDBCを選択します ドライバー:

    次へをクリックします 、およびプロパティダイアログから新しいドライバ定義をクリックします :

    これにより、入力する一連のタブが表示されます:

    JARリストをクリックします タブ、 JAR/Zipの追加… ダウンロードしたSnowflake.jarファイルを参照して使用します:

    次に、プロパティで タブで、接続URL、データベース名、およびユーザーIDを指定します。 ドライバー クラス ドライバークラスをクリックしたときにフィールドの右側に表示されるボタンをクリックして、.jarファイルを解析します。 フィールドをクリックし、[参照]をクリックします 。 netで始まるオプションを使用します 。

    これらの詳細が決まったら、[ OK]をクリックします 。メインプロパティ画面が表示されます。パスワードを再入力し、[パスワードの保存]をクリックして、WBの使用時にプロンプ​​トが表示されないようにします。 オプションをクリックします タブをクリックし、「warehouse=」と入力してウェアハウスの名前を指定します。完了したら、[接続のテスト]をクリックします および終了

    Snowflake Data Warehouseに接続すると、IRIWorkbenchのDataSourceExplorerビューで使用可能なデータベースカタログを展開してアクセスできるようになります。

    右クリックして、接続リストの「New Generic JDBC」の名前を、「Snowflake」などのよりわかりやすい名前に変更することもできます。

    ステップ4:接続を登録してブリッジする

    IRIワークベンチからデータ接続レジストリを開きますウィンドウ>設定>IRI グループ。

    上記のスノーフレーク用に作成したDSNがリストに表示されていない場合は、[更新]ボタンをクリックします。表示されたら、このエントリをダブルクリックするか、[編集...]をクリックして、接続ダイアログを開きます。

    必要に応じてスキーマフィルターを追加します。 ODBCドライバーはパスワードを保存しないため、認証にパスワードを入力します セクション。 JDBC接続の接続プロファイルを選択します:

    この接続を登録することにより、ODBCを介してSnowflakeデータを移動および操作するIRI実行可能ファイルと、JDBC接続を使用してテーブルメタデータを解析および使用するIRIWorkbenchウィザード間のアクセス許可をマッピングします。これにより、IRIWorkbenchがデータレイアウトと列レベルのジョブ仕様を作成して視覚的に操作できるようになります。

    ステップ5:テストする

    この後、すべてを構成する必要があります。データソースエクスプローラー(JDBCを使用)で必要なデータベースとテーブルを開くことで、両方を確認できます。スキーマ内のテーブルを右クリックし、[DDFの生成]を選択します IRIメニューから次のことを明らかにします:

    IRI WorkbenchでSnowflakeインスタンスを接続する方法については、IRI担当者にお問い合わせください。


    1. PostgreSQLとApacheSparkを使用したビッグデータ

    2. 初心者向けのGitのヒントとベストプラクティス

    3. NEWを参照する行のPostgres関数のNULL値

    4. MicrosoftSQLServerのディザスタリカバリのベストプラクティス