簡単な答えは次のとおりです。平均だけに基づくのではなく、できません。ドキュメントサイズ(少なくとも正確な方法ではありません)。
より詳細に説明するには:
ディスクに必要なスペースは、単に平均ドキュメントサイズの関数ではありません。作成するインデックスに必要なスペースもあります。次に、これらの移動をトリガーする場合に必要なスペースがあります(パディングにもかかわらず、これは発生します)-そのスペースは再利用するためにリストに配置されますが、後で挿入するデータに応じて、そのスペースを再利用します。
また、事前割り当てにより、新しいデータファイルが割り当てられるときに、少数のドキュメントによってディスク上のスペースの使用率が最大2GB増加する場合があるという事実を追加することもできます。もちろん、十分なデータがあれば、これは本質的に丸め誤差になりますが、覚えておく価値があります。
一貫した使用パターンを想定して、このタイプのデータとサイズの比率を推定する唯一の方法は、特定のユースケースで時間の経過とともにトレンドを把握し、挿入されたデータに対するディスクスペースの使用量を追跡することです(ドキュメントの数はデータ量よりも優れている場合があります)ドキュメントサイズの変動に応じて)
同様に、挿入率、ドキュメントサイズ、および再同期/修復から得られたスペースを追跡する場合。参考までに-セカンダリを最初から再同期して、修復を実行するのではなく、データファイルの「新しい」コピーを取得できます。これにより、中断が少なくなり、セットアップによっては使用するスペースが少なくなります。