utf8
はエンコーディング(Unicode文字を一連のバイトとして表す方法)であり、照合(どの文字がどの文字の前にあるか)ではありません。
Postgres10の照合はutf8_general_ci
と同等だと思います (またはより現代的なutf8_unicode_ci
)はund-x-icu
と呼ばれます -これは、ICUライブラリによって提供される未定義の照合(実際の言語では定義されていません)です。この照合により、ほとんどの言語の文字がかなり合理的にソートされます。
ICUサポートはPostgreSQL10で追加された新機能であるため、この照合は、古いバージョンのPostgreSQLや、コンパイル中に無効にされた場合は使用できません。それ以前は、Postgresはオペレーティングシステムによって提供される照合サポートを使用していましたが、これはオペレーティングシステムによって異なります。