C++ 如何确保 gcc + libc 对于多字节字符串使用 UTF8，对于 wchar_t 使用 UTF32

发布于08月10日

我想知道如何强制GCC+GNU libc工具链进入正常的Unicode行为，其中源代码文件编码为Utf-8，编译后的程序使用Utf-8作为其多字节字符集，Utf-32LE作为其wchar_t，而不考虑任何语言环境信息.

我希望能够百分百地知道它会奏效.

我知道通常的答案是使用setlocale(LC_ALL, "en_US.utf8")，但是您似乎只能知道setLocale(LC_ALL，"en_US.utf-8")在运行时是否可以工作，因为只有"C"和"POSIX"语言环境可以保证存在，而且，除非我遗漏了什么，否则您不能将语言环境编译到您的可执行文件中.

GCC有这些标志-finput-charset=utf-8 -fexec-charset=utf-8 -fwide-exec-charset=utf-32le，但不清楚它们如何与setLocale()一起使用.如果我使用了它们，我需要调用setLocale()吗？它们是否被setLocale()覆盖？

似乎应该有一些可靠的方法来强制GCC+libc进入正常的unicode行为，而不必知道源系统或目标系统上预安装了什么区域设置.

C++ 如何确保 gcc + libc 对于多字节字符串使用 UTF8，对于 wchar_t 使用 UTF32

推荐答案

C++相关问答推荐

rSP堆栈指针在返回函数调用的值时有任何用途吗？

有效地计算由一组点构成的等边三角形和等腰三角形的数量

VS代码C/C++扩展intellisense无法检测环境特定函数'

C/SDL程序，渲染不使用我的渲染器

为什么我会收到释放后堆使用错误？

X64：并发写入布尔数组

S的这种管道实施有什么问题吗？

用C语言计算文本文件中的整数个数

为 struct 中的数组动态分配内存时出错

理解bzip2的BZ2_解压缩函数中的状态重新分配

初始成员、公共初始序列、匿名联合和严格别名如何在C中交互？

条件跳转或移动取决于未初始化值(S)/未初始化值由堆分配创建(Realloc)

GetText不适用于包含国际字符的帐户名称

隐藏测试用例无法在c程序中计算位数.

STM32 FATFS用户手册(Um1721)中的代码正确吗？

C中的空指针是什么(_N)？

`%%的sscanf无法按预期工作

在 C 中传递参数时出现整数溢出

如何确保 gcc + libc 对于多字节字符串使用 UTF-8，对于 wchar_t 使用 UTF-32？

如何让 unlinkat(dir_fd, ".", AT_REMOVEDIR) 工作？