sql >> データベース >  >> RDS >> PostgreSQL

postgresqlデータベースにMrjobとHadoopを取り込む方法

    各マッパーには、独自のデータベース接続が必要です。 mapper_init()でデータベース接続を作成します mapper_final()で閉じます 。 mrjobスクリプトとは別にデータベースを作成する必要があります。最初にいくつかの非常に単純なmrjobスクリプトを試す必要があります。あなたはそれを正しい方法で始めていません。ドキュメントの例に目を通します。




    1. NOT INを使用すると、PostgreSQLのクエリが遅くなります

    2. 監査目的でsyscontext/Hibernateとの接続でClientInfo/ClientIdentifierを渡す

    3. ElasticSearch RiverJDBCMySQLがレコードを削除しない

    4. OracleのTAN()関数