ステミングアルゴリズムのポイントはではありません すべての単語を適切な語幹に減らす。目標は、一般的な語幹形式に似ている単語を減らすことです。目標は通常、ユーザーに提示できる単語を取得しないことです。「balling」と「ball」の両方が「kjebnkkekaa」を生成する場合でも、「balling」と「ball」は一般的に関係していると見なされるため、アルゴリズムは正しいです。同じことです。
また、完全なステミングアルゴリズムはないことに注意してください。詳細については、PorterStemmingアルゴリズムを調べてください