我在Django tutorial米比赛中偶然发现了这段话:
Django模型有一个默认的str()方法,该方法调用unicode()并将结果转换为UTF-8字节字符串.这意味着Unicode(P)将返回Unicode字符串,而str(P)将返回普通字符串,字符编码为UTF-8.
现在,我很困惑,因为afaik Unicode不是任何特定的表示,那么Python中的"Unicode字符串"是什么呢?这是指UCS-2吗?谷歌搜索出了this "Python Unicode Tutorial"条,其中大胆地指出
Unicode是一种双字节编码,涵盖了世界上所有常见的书写系统.
这显然是错的,还是真的?我曾多次被字符集和编码问题弄糊涂,但在这里我很确定我正在阅读的文档是混乱的.当Python给我一个"Unicode字符串"时,有人知道它在做什么吗?