编码:ASCII 、UniCode、UTF-8

计算机只能直接处理数字,如果需要处理其他数据格式,例如文本格式,需要转为对应得数字。早期只有大小写英文字母,数字和一些特殊符号共127个,也就是常见的ascii码。由于一般用字节来表示数据,一个字节是8bit,最大可表示255,随着计算机的普及,越来越多的语言需要编入电脑里,而原先的编码格式显然不够,所以诞生了Unicode编码,将所有语言都统一到一套编码中。
看似问题得到了解决,但新的问题就来了。原先的ascii码只用一个8字节就可以表示,而Unicode码通常是2个字节,这样对于数据的存储以及数据的传输就会显得很浪费。所以就有了UTF-8编码,该编码可以根据待传输的数据大小编码成1-6个字节,常用的英文字母为1个字节,汉字通常是3个字节,使用UTF-8编码可以节省空间。

猜你喜欢

转载自blog.csdn.net/DOUBLE121PIG/article/details/90577213