常见文件编码 - 多字节编码与Unicode编码区别

背景:
之前在VS中的项目属性里,会见到设置多字节编码和Unicode编码的选项。不是很明白,后面在一本书中,得到了解释,故特意记下来。


对于英语,其字符总数不超过256个,因而每个字符可以使用一个字节来表示,所形成的编码方案就是大家熟知的ASCII编码。

对于汉字,这些编码方案则采用2个甚至更多的字节来表示。我们将这种一个字符可能对应1个或者多个字节的编码方案称为多字节编码(multibytes encoding)。

Unicode编码方式为世界上各种语言的每个字符指定一个统一、唯一的编号。将这个编号转化为字节序列时,却有着不同的方案,从而形成不同的Unicode编码方案,比如UTF-8、UTF-16等。

UTF-8采用了多字节编码方式,常用的英语字符采用1个字节表示,其他的字符采用2~4个字节表示。

猜你喜欢

转载自blog.csdn.net/no_say_you_know/article/details/126509757