编码格式:GBK(多字节),Unicode编码,UTF-8,UTF-16,char与wchar_t(tchar)的关系

版权声明:就算是个菜鸟,我也有版权 https://blog.csdn.net/qq_33248019/article/details/88367810

多字节编码
基本可以算是GBK编码,而在C/C++,经常使用的char和string,都算是多字节编码(GBK),char类型占用一个字节,8 bit,最多可以表示256个字符。
Unicode编码
Unicode的学名 是"Universal Multiple-Octet Coded Character Set",简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。UCS只是规定如何编码,并没有规定如何传输、保存这个编码。UTF是“UCS Transformation Format”的缩写。
而常见的UTF-8与UTF-16都属于Unicode编码。
UTF-8使用的是1~3个字节来进行表示。
UTF-16使用的是2~4个字节来进行表示。
在Visual Studio中Unicode编码默认为UTF-16编码。
而wchar_t占用双字节——16 bit。

猜你喜欢

转载自blog.csdn.net/qq_33248019/article/details/88367810