Chapter III javaweb coding

第三章javaweb编码
ASCII码是用来表示英文字符的一种编码规范,每个ASCII字符占用1个字节,最大字符数是255(0-255)
ANSI(ASCII字符集以及由此派生并兼容的字符集,如:GB2312,通常称为ANSI字符集)
Unicode全新的编码系统,对于JAVA/.NET等这些“新”的语言来说,内置的字符串所使用的字符集已经完全是Unicode
...常见编码格式
1.ascll码,共128个,单字节编码.数字的ASCII码<大写字母的ASCII码<小写字母的ASCII码,查询ASCII技巧,
方便查询ASCII码对应的字符:新建一个文本文档,按住ALT+要查询的码值(注意,这里是十进制),松开即可显示出对应字符.例如:按住ALT+97,则会显示出'a'.
2.iso-8859-1 拓展ascll码,覆盖大多数西欧语言字符,单字节编码,共256个(0-255).
3.GB2312信息技术中文编码字符集,双字节编码,包含6763个汉字
4.GBK汉字内码拓展规范,拓展了GB2312,能表示21003个汉字
5.GB18030信息技术中文编码字符集包含单字节,双字节,四字节,兼容GB2312
6.UTF-16具体定义了Unicode字符在计算机中的存取方法,用2个字节表示Unicode的转化格式,采用定长表示方法,
2个字节16个bit谓之UTF-16.java以UTF-16作为内存的字符存储格式!!!
7.UTF-8比UTF-16更具有实际数据传输意义,其中的变长技术每个区域的编码都有不同的字码长度,可以由1~6个字节组成.
UTF-8编码规则
.如果是1个字节,最高位(第八位)为0,则表示这个是1个ASCll字符
.如果是1个字节,以11开头,连续的1个的个数表示这个字符的字节数,例如110xxxxx代表它是双字节UTF-8字符的首字节
.如果是1个字节以10开始,表示它不是首字节,需要向前查才能得到当前字符首字节
Published 52 original articles · won praise 7 · views 10000 +

Guess you like

Origin blog.csdn.net/YKWNDY/article/details/86632599