考慮すべき要素がいくつかあります:
- 並べ替えはN.log(N)操作です。
- 14M行の並べ替えは、メインメモリにうまく収まる可能性があります。 5億行の並べ替えはおそらくそうではないため、並べ替えがディスクに流出し、処理速度が大幅に低下します。
係数のサイズは約30であるため、ビッグデータセットの公称ソート時間は2時間未満で50倍のオーダーになります。ただし、データ値ごとに8バイトが必要であり、さらに約8バイトのオーバーヘッドが必要です(これは推測です。インデックスに何が格納されるかについて詳しく知っている場合は、mySQLに調整してください)。つまり、14M×16≈220MBのメインメモリです。ただし、500M×16≈8GBのメインメモリ。マシンに十分なメモリがない限り(そしてMySQLがそれを使用するように構成されていない限り)、大きな種類がディスクに溢れ、残りの時間の多くを占めます。