到底是宽字符还是多字符?到底是宽字节还是多字节?

多字节-multibyte
宽字符-widechar
非英语系的大部分语言,存在无法用有限的ascii字符表达的问题。
由此产生了使用多字节字符来表示的办法,比如GB编码的汉字。但多字节带来的一个显著不便就是多字节字符在处理的时候不太方便。比如文本编辑的时候,中英文混排,光标移动、汉字删除时会出现半个汉字的问题。

为了文本处理的方便,许多系统内部采用了将多字节字符和单字节字符都转换称宽字符的办法,将所有的字符都变成等宽,一切都方便了。
这就是说英文字符也可以采用宽字符的表达方式。也是我说上面的说发不够准确的原因。


但宽字符也不是完美的。最简单的问题就是使得采用unicode编码的英文文本体积会扩大一倍....:)

猜你喜欢

转载自blog.csdn.net/jigetage/article/details/80138082