コード内の何かが文字列をUTF8として処理していません。 PHP / HTMLの場合もあれば、DBへの接続の場合もありますが、DB自体の場合もあります。すべてを一貫してUTF8として設定する必要があります。そうでない場合、文字列は正確に切り捨てられます。 UTF8/非UTF8境界を通過するときを確認してください。
DBがUTF8に準拠していると仮定します。これが最も簡単に確認できます。照合は、サーバーレベル、データベースレベル、テーブルレベル、およびテーブル内の列レベルで設定できることに注意してください。列にUTF8照合を設定すると、ストレージの他のすべてがオーバーライドされますが、UTF8でない場合は、他のユーザーがDBと通信するときに起動します。よくわからない場合は、接続を開いた後、明示的にUTF8に設定してください:
$dbh->setAttribute(PDO::MYSQL_ATTR_INIT_COMMAND, "SET NAMES 'utf8'");
これで、DBと接続がUTF8になりました。また、WebページもUTF8であることを確認してください。繰り返しますが、これは複数の場所(.htaccess、php.ini)で設定できます。よくわからない/アクセスできない場合は、ページの上部でPHPがデフォルトとして取得しているものをすべてオーバーライドしてください:
<?php ini_set('default_charset', 'UTF-8'); ?>
ページからテキストが出力される前に、最初に上記が必要であることに注意してください。テキストが出力されると、エンコーディングを指定するのに遅すぎる可能性があります。サーバーのデフォルトにロックされている可能性があります。次に、これをヘッダーで繰り返します(おそらくやり過ぎです):
<head>
<meta charset="UTF-8">
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">
</head>
また、データを取得しているフォームでもオーバーライドします:
<FORM NAME="utf8-test" METHOD="POST" ACTION="utf8-test.php" enctype="multipart/form-data" accept-charset="UTF-8">"
正直なところ、エンコーディングを一番上に設定した場合、他のオーバーライドは必要ないというのが私の理解ですが、それでも何も壊れないので、とにかくそれらを保持します。サーバーに仮定をさせるよりも、明示的にエンコードします。
最後に、phpMyAdminに文字列を挿入したところ、期待どおりに表示されたとのことですが、phpMyAdminページがUTF8であることは確かですか?私は彼らがそうではないと思います。 PHPコードからUTF8データを保存すると、phpMyAdminに生の8ビット文字のように表示されます。同じ文字列を取得してphpMyAdminに直接保存すると、「正しい」ように見えます。したがって、phpMyAdminは、必ずしもUTF8ではなく、ローカルサーバーのデフォルトの文字セットを使用していると思います。
たとえば、私のWebページから保存された次の文字列:
I can’t wait
私のphpMyAdminでこのように読みます:
I can’t wait
phpMyAdminがディスプレイまたはDB接続に使用しているエンコーディングがよくわからないため、この方法でテストする場合は注意が必要です。
それでも問題が解決しない場合は、以下のコードを試してください。まず、テキストをUTF8に格納するためのテーブルを作成します:
CREATE TABLE IF NOT EXISTS `utf8_test` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`my_text` varchar(8000) NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;
そして、これをテストするためのPHPがいくつかあります。基本的に、フォームへの入力を受け取り、その入力をエコーして返し、DBからテキストを保存/取得します。私が言ったように、phpMyAdminでデータを直接表示すると、データが正しく表示されない場合がありますが、ページとデータベース接続の両方がUTF8にロックされているため、下のページでは常に期待どおりに表示されます。
<?php
// Override whatever is set in php.ini
ini_set('default_charset', 'UTF-8');
// The following should not be required with the above override
//header('Content-Type:text/html; charset=UTF-8');
// Open the database
$dbh = new PDO('mysql:dbname=utf8db;host=127.0.0.1;charset=utf8', 'root', 'password');
// Set the connection to UTF8
$dbh->setAttribute(PDO::MYSQL_ATTR_INIT_COMMAND, "SET NAMES 'utf8'");
// Tell MySql to do the parameter replacement, not PDO
$dbh->setAttribute(PDO::ATTR_EMULATE_PREPARES, false);
// Throw exceptions (and break the code) if a query is bad
$dbh->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);
$id = 0;
if (isset($_POST["StoreText"]))
{
$stmt = $dbh->prepare('INSERT INTO utf8_test (my_text) VALUES (:my_text)');
$stmt->execute(array(':my_text' => $_POST['my_text']));
$id = $dbh->lastInsertId();
}
?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional/EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta charset="UTF-8">
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">
<title>UTF-8 Test</title>
</head>
<body>
<?php
// If something was posted, output it
if (isset($_POST['my_text']))
{
echo "POSTED<br>\n";
echo $_POST['my_text'] . "<br>\n";
}
// If something was written to the database, read it back, and output it
if ($id > 0)
{
$stmt = $dbh->prepare('SELECT my_text FROM utf8_test WHERE id = :id');
$stmt->execute(array(':id' => $id));
if ($result = $stmt->fetch())
{
echo "STORED<br>\n";
echo $result['my_text'] . "<br>\n";
}
}
// Create a form to take some user input
echo "<FORM NAME=\"utf8-test\" METHOD=\"POST\" ACTION=\"utf8-test.php\" enctype=\"multipart/form-data\" accept-charset=\"UTF-8\">";
echo "<br>";
echo "<textarea name=\"my_text\" rows=\"20\" cols=\"90\">";
// If something was posted, include it on the form
if (isset($_POST['my_text']))
{
echo $_POST['my_text'];
}
echo "</textarea>";
echo "<br>";
echo "<INPUT TYPE = \"Submit\" Name = \"StoreText\" VALUE=\"Store It\" />";
echo "</FORM>";
?>
<br>
</body>
</html>