ASCⅡ等编码

ASCII就是编码英文的26个字母和一些常见的符号，之后扩展了一半。总之是一个字节来做编码，大于128的部分是一些特殊符号。但ASCII是无法编码别的东西的，比如说是不存在“中文的ascii码需要2个字符”这种说法的。ASCII就只有一个字节。

Unicode是足够编码地球上所有的语言了，所以ASCII中所能表示的，Unicode当然全部包括了。Unicode本身是只有2个字节的，之所以出现UTF-8,UTF-16等等之类，那是为了针对不同的应用环境，提高整体编码效率，比如如果某篇文章里绝大部分是英语（单字节就能表示），就比较适合使用utf-8，而如果绝大部分是中文（需要双字节），可能就utf-16比较合适了

ASCII码使用一个字节编码，所以它的范围基本是只有英文字母、数字和一些特殊符号，只有256个字符。
在表示一个Unicode的字符时，通常会用“U+”然后紧接着一组十六进制的数字来表示这一个字符。在基本多文种平面（英文为 Basic Multilingual Plane，简写 BMP。它又简称为“零号平面”, plane 0）里的所有字符，要用四位十六进制数（例如U+4AE0，共支持六万多个字符）；在零号平面以外的字符则需要使用五位或六位十六进制数了。旧版的Unicode标准使用相近的标记方法，但却有些微的差异：在Unicode 3.0里使用“U-”然后紧接着八位数，而“U+”则必须随后紧接着四位数。
Unicode能够表示全世界所有的字节
GBK是只用来编码汉字的，GBK全称《汉字内码扩展规范》，使用双字节编码。

UTF-8（8-bit Unicode Transformation Format）是一种针对Unicode的可变长度字符编码，又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言（如英文，日文，韩文）。

猜你喜欢