それはうまくいくかもしれませんが、アルゴリズムの解決策しかないため、それらを防ぐ方法がないため、誤った一致が発生する可能性があります。最善の策は、エイリアス テーブルを作成することです。各会社名についてこれまでに見つかったすべてのバリエーションと、実際の会社の ID への FK を含めます。実際の名前の行も含めてください。
AliasID CompanyID CompanyAlias ------- --------- ------------ 1 1 Company X, Inc <<--actual real company name 2 1 Company X Inc 3 1 Company X
プレ>データのインポート時にこのテーブルで正確な名前の一致が見つからない場合は、提案されたアルゴリズムまたは別のアルゴリズムを使用するか、人間の入力などを使用して、一致を見つけるか、新しい会社を生成することができます。その時点で、別名テーブルに挿入します。何らかの理由で一致が間違っていることがわかった場合は、エイリアス テーブルを変更して適切なマッピングを行うことができます。アルゴリズムのみを使用する場合は、例外を含める必要があり、アルゴリズムが大きくなり遅くなります。この表と適切な索引があれば、一致するものをすばやく見つけることができます。