sql >> データベース >  >> RDS >> Mysql

AWSEMRPySparkがmysqlに接続します

    Amazon EMR3.xまたはEMR4.xでSparkジョブを実行する場合は、次のことを行う必要があります。

    1) spark-defaults.confについて言及できます ブートストラップ中のプロパティ。つまり、ドライバークラスパスの構成を変更できます。 およびエグゼキュータクラスパス プロパティとma​​ximizeResourceAllocation (必要に応じて、コメントで詳細を確認してください。)ドキュメント

    2)必要なすべてのjar(mysql-connector.jarおよびmariadb-connector.jar)をダウンロードする必要があります。MariaDBおよびMySQLコネクタのJDBC jarを、すべてのノードのSpark、Yarn、Hadoopなどのすべてのクラスパスの場所にダウンロードします。 MASTER、CORE、またはTASK (Spark On Yarnシナリオが最もカバーします)ブートストラップスクリプトのドキュメント

    3)また、Sparkジョブがドライバーノードからデータベースにのみ通信している場合は、-jarsを使用するだけでよい場合があります。 例外は発生せず、正常に機能します。

    4)マスターを糸クラスターとして試すこともお勧めします ローカルの代わりに またはyarn-client

    あなたの場合、MariaDBまたはMySQLを使用している場合は、jarファイルを $ SPARK_HOME / libにコピーしてください。 、 $ HADOOP_HOME / lib クラスタのすべてのノードでなどを実行してから、試してみてください。

    後で、ブートストラップアクションを使用できます クラスタの作成時にすべてのノードにjarファイルをコピーします。

    詳細については、以下にコメントしてください。




    1. MssqlのUNIQUEKEY制約に重複するnull値違反

    2. 既存の制約に制約名を追加する方法

    3. データベースをアタッチするにはどうすればよいですか?

    4. 外部キーを自己参照することの意味は何ですか?