コネクタに問題があるとのことで、ごめんなさい。
パーティショナーに関する情報は、Sparkコネクタのドキュメントサイトにあります。 a> 。 Docsjiraプロジェクト にチケットを提出してください 何か足りないものや不明瞭なものがあると感じた場合、それは将来のユーザーに本当に役立つ可能性があります!
デフォルトのパーティショナーは、 MongoSamplePartitioner<の薄いラッパーです。 / code>
。コレクションの統計的サンプリングに基づいて、コレクションをサイズのパーティションに分割します。
MongoShardedPartitioner
shardKey
を使用します パーティションを生成します。デフォルトでは、 _id
を使用します キーとして。その値を構成する必要があるかもしれません。
注: ハッシュされたシャードキーはない MongoShardedPartitioner
によってサポートされています 現在、ハッシュ値に対してコレクションをクエリする方法はありません。そのため、パーティションを取得するときに結果を返すことができません。 DOCS-12345
を追加しました ドキュメントを更新します。
MongoShardedPartitioner
のセットアップに問題があるようです 期待どおりにコレクションを分割できず、0の結果が返されます。コレクションのクエリ方法により、スキーマ推論は引き続き機能します。 config / hashed shardkeyの問題でない場合は、Sparkjiraプロジェクト> 原因を特定し、修正をリリースするお手伝いをします。