全文索引を実装するために、ソートされたセットで同様のアプローチを使用しています。全体的なアプローチは優れていますが、かなり単純な改善をいくつか行うことができます。
- ランダムに生成されたキーを使用する代わりに、クエリ(またはその短縮形)をキーとして使用できます。これにより、すでに計算されたセットを再利用できます。これにより、一般的に同様の方法で組み合わされる2つの大きなセットにまたがるクエリがある場合、パフォーマンスが大幅に向上する可能性があります。
- タイトルを完全な文字列として処理すると、非常に多くの単一メンバーセットが生成されます。本当に必要な場合は、タイトル内の個々の単語にインデックスを付け、最終結果をフィルタリングして完全に一致させる方がよい場合があります。