直到今天,我才意识到我在PHP脚本中遗漏了这一点:
mysql_set_charset('utf8');
我所有的表都是InnoDB,排序规则是"utf8_unicode_ci",我所有的VARCHAR列也是"utf8_unicode_ci".我的PHP脚本上有mb_internal_encoding('UTF-8');
个,我所有的PHP文件都编码为UTF-8.
所以,直到现在,每次我"插入"带有变音符号的东西,例如:
mysql_query('INSERT INTO `table` SET `name`="Jáuò Iñe"');
在本例中,"名称"内容为:Jáuò Iñe
.
由于我修复了PHP和MySQL之间的字符集,新的插入现在可以正确存储.但是,我想修复目前"混乱"的所有旧行.我已经try 了很多方法,但它总是会 destruct 第一个"非法"字符的字符串.以下是我目前的代码:
$m = mysql_real_escape_string('¿<?php echo "¬<b>\'PHP á (á)ţăriîş </b>"; ?> ă-ţi abcdd;//;ñç´พดแทฝใจคçăâξβψδπλξξςαยนñ ;');
mysql_set_charset('utf8');
mysql_query('INSERT INTO `table` SET `name`="'.$m.'"');
mysql_set_charset('latin1');
mysql_query('INSERT INTO `table` SET `name`="'.$m.'"');
mysql_set_charset('utf8');
$result = mysql_iquery('SELECT * FROM `table`');
while ($row = mysql_fetch_assoc($result)) {
$message = $row['name'];
$message = mb_convert_encoding($message, 'ISO-8859-15', 'UTF-8');
//$message = iconv("UTF-8", "ISO-8859-1//IGNORE", $message);
mysql_iquery('UPDATE `table` SET `name`="'.mysql_real_escape_string($message).'" WHERE `a1`="'.$row['a1'].'"');
}
它使用预期的字符"更新",但字符串在字符"ă"之后被截断.我的意思是,这个字符和后面的字符不包括在字符串中.
此外,使用"iconv()"(即对代码进行注释)进行测试也会进行同样的操作,即使使用//忽略和//翻译也是如此
我还测试了几个字符集,介于ISO-8859-1和ISO-8859-15之间.