sql >> データベース > >> RDS >> Mysql

mySQL：レーベンシュタイン距離を使用して20,000行の重複を検索

実行時間を半分に短縮する可能性のある最適化を少なくとも1つ知っています：

AND a.id < b.id

これにより、すでにa =2、b =1をテストしている場合に、a =1、b=2をテストできなくなります。

それでもO（n ^ 2）になるでしょうが、どうすればそれについて多くのことができるのかわかりません。

無効なXML形式-これを回避する方法 mysql-utilitiesから何も実行できません：mysql.utilities.common.toolsという名前のモジュールがありません