sql >> データベース >  >> RDS >> Mysql

mySQL:レーベンシュタイン距離を使用して20,000行の重複を検索

    実行時間を半分に短縮する可能性のある最適化を少なくとも1つ知っています:

    AND a.id < b.id
    

    これにより、すでにa =2、b =1をテストしている場合に、a =1、b=2をテストできなくなります。

    それでもO(n ^ 2)になるでしょうが、どうすればそれについて多くのことができるのかわかりません。



    1. OracleのPLSQLレコードとは

    2. rand()を使用したこのMySQLクエリが約3分の1の時間で結果を返さないのはなぜですか?

    3. SQL:特定のアイテムのセットを含むすべてのバスケットを選択します

    4. mysql-utilitiesから何も実行できません:mysql.utilities.common.toolsという名前のモジュールがありません