直到今天,我才意识到我在PHP脚本中遗漏了这一点:

mysql_set_charset('utf8');

我所有的表都是InnoDB,排序规则是"utf8_unicode_ci",我所有的VARCHAR列也是"utf8_unicode_ci".我的PHP脚本上有mb_internal_encoding('UTF-8');个,我所有的PHP文件都编码为UTF-8.

所以,直到现在,每次我"插入"带有变音符号的东西,例如:

mysql_query('INSERT INTO `table` SET `name`="Jáuò Iñe"');

在本例中,"名称"内容为:Jáuò Iñe.

由于我修复了PHP和MySQL之间的字符集,新的插入现在可以正确存储.但是,我想修复目前"混乱"的所有旧行.我已经try 了很多方法,但它总是会 destruct 第一个"非法"字符的字符串.以下是我目前的代码:

$m = mysql_real_escape_string('¿<?php echo "¬<b>\'PHP &aacute; (á)ţăriîş </b>"; ?> ă-ţi abcdd;//;ñç´พดแทฝใจคçăâξβψδπλξξςαยนñ ;');
mysql_set_charset('utf8');
mysql_query('INSERT INTO `table` SET `name`="'.$m.'"');
mysql_set_charset('latin1');
mysql_query('INSERT INTO `table` SET `name`="'.$m.'"');
mysql_set_charset('utf8');

$result = mysql_iquery('SELECT * FROM `table`');
while ($row = mysql_fetch_assoc($result)) {
    $message = $row['name'];
    $message = mb_convert_encoding($message, 'ISO-8859-15', 'UTF-8');
    //$message = iconv("UTF-8", "ISO-8859-1//IGNORE", $message);
    mysql_iquery('UPDATE `table` SET `name`="'.mysql_real_escape_string($message).'" WHERE `a1`="'.$row['a1'].'"');
}

它使用预期的字符"更新",但字符串在字符"ă"之后被截断.我的意思是,这个字符和后面的字符不包括在字符串中.

此外,使用"iconv()"(即对代码进行注释)进行测试也会进行同样的操作,即使使用//忽略和//翻译也是如此

我还测试了几个字符集,介于ISO-8859-1和ISO-8859-15之间.

推荐答案

从您描述的情况来看,似乎您有UTF-8数据,这些数据最初存储为拉丁语-1,然后没有正确转换为UTF-8.数据是可恢复的;你需要一个MySQL函数,比如

convert(cast(convert(name using  latin1) as binary) using utf8)

可能需要省略内部转换,这取决于编码转换期间数据的更改方式.

Mysql相关问答推荐

同一类型对象之间的多对多关系

在MySQL中查找具有公共值的列名

左联接重复问题

Mysql:使用like Select 查询

获取每个参数的记录,不重复

计算MySQL中的连续出现

从 mysql RDS 导出数据以导入 questDb

根据单个日期字段获取范围/天数

仅当其他行相等时才 Select 行值

MYSQL:范围匹配与周年纪念日

如何知道 Select 查询花费了多少时间?

处理 Visits 表中数百万行的最佳方法是什么?

有没有更好的方法在无限滚动的网页上呈现获取的提要数据?

在 SQL 中将列添加为 End_date,间隔为 +100 天

如何在 MySQL 上一次删除一系列记录?

如何删除没有临时表的 MySQL 表中的所有重复记录

Doctrine2 迁移向下迁移并从浏览器而不是命令行迁移

带有 OuterRef 的简单子查询

ON UPDATE RESTRICT 有什么作用?

创建一个没有 :id 列的 ActiveRecord 数据库表?