ここからストップワード(キーワード以外)のリストを取得します。男はそれらをphpでフォーマットしました。
次に、インデックスを作成している文字列に対してpreg_replaceを実行します。
私が過去に行ったことは、正規表現で「s」、「ed」などの接尾辞を削除し、検索文字列で同じ正規表現を使用することです。しかし、それは理想的ではありません。これは、200ページしかない基本的なWebサイト用でした。
パフォーマンスが心配な場合は、データベースの代わりにLucine(solr)のような検索エンジンの使用を検討することをお勧めします。これにより、インデックス作成がはるかに簡単になります。ここで車輪の再発明をしたくありません。