setlocale同mbstowcs函数的关系（VS2008下setlocale(LC_ALL, "chs")可以执行成功，BCB使用setlocale(LC_ALL, "Chinese (Simplified)_People's Republic of China")，linux上locale别名表大概在 /usr/lib/X11/locale/locale.alias）

序中，如果要将ASCII码字符串转换为宽字符（Unicode），可以利用标准C的mbstowcs函数。

微软在MSDN中有示例，如下：

然而，这段代码在处理含有汉字的字符串时就会出现问题。比如将：

wchar_t *pwchello = L"Hi"; 替换为wchar_t *pwchello = L"你好";

查看运行结果就会发现，mbstowcs函数将汉字视作两个ASCII字符，这样一个汉字就变成了两个wchar_t。原因是mbstowcs需要我们明确的告诉他要转换的字符语言。这里需要使用setlocale函数。在网上发现不少人遇到这个问题，微软的MSDN也是，为什么这里就不说明一下呢？

只要在调用前，使用setlocale(LC_ALL, "chs")设置，结果就正常了。

我测试在英文Vista操作系统内，Visual Studio 2008下setlocale(LC_ALL, "chs")可以执行成功。

但是在Borland C++Builder 6、CodeGear RAD Studio 2009下执行都失败，BCB提供的帮助文件内也未找到，反复测试使用setlocale(LC_ALL, "Chinese (Simplified)_People's Republic of China")可以奏效（这么大一个长串，BCB对搞中文编码的程序员也够狠）。

更讽刺的是，在BCB内使用setlocale(LC_ALL, "jpn")，或"cht"都可以成功。唯独就不支持"chs"，对BCB的做法彻底无语了。我相信在大多数unix或linux上也还是支持"chs"的。如果有时间，我再搞一个MinGW试试看。

另外如果程序运行在非中文操作系统内，使用setlocale修改运行时字符集环境，会影响当前应用程序的编码方式，因此使用前需要保留一下老的编码，使用后再恢复。

for 在linux上coding的兄弟们，locale别名表大概在 /usr/lib/X11/locale/locale.alias

http://www.cppblog.com/fwxjj/archive/2010/05/25/116303.html

setlocale同mbstowcs函数的关系（VS2008下setlocale(LC_ALL, "chs")可以执行成功，BCB使用setlocale(LC_ALL, "Chinese (Simplified)_People's Republic of China")，linux上locale别名表大概在 /usr/lib/X11/locale/locale.alias）

猜你喜欢