簡単に言うと、実行する作業の処方箋であるデータフレームを作成しましたが、実行していません。実行するには、.compute()
を呼び出す必要があります 結果について。
ここでの出力は実際にはデータフレームではないことに注意してください。各パーティションはNone
と評価されます。 (to_sql
のため 出力がないため)、これをdf.to_delayed
で表現する方がクリーンな場合があります。 、
dto_sql = dask.delayed(pd.DataFrame.to_sql)
out = [dto_sql(d, 'table_name', db_url, if_exists='append', index=True)
for d in ddf.to_delayed()]
dask.compute(*out)
また、良好な並列処理が得られるかどうかは、データベースドライバーとデータシステム自体に依存することに注意してください。