一文一图理解各种字符及编码,字符,字符集,字符编码,ANSI,ASCII,ISO-8859,GBK,gb2312,Big5,UTF,Unicode等概念

字符:可以分为两种,可见字符和不可见字符

    1、可见字符,英文字母,汉字,五十音图,俄文,六点盲文,标点符号,自创汉字或者符号等都可以称作字符

     2、不可见字符,用于特殊用途的字符,控制字符,打印字符,声音字符,空格字符等

字符集:将上述字符放在按照一定标准放在一起就组成对应的字符集,可以自己定义字符集,计算机世界的字符集主要有:

    美国本地ascii------》各国本地ansi-------》国际化(unicode和iso)

    1、ascii码字符集合:美国标准信息交流码,分为7位127个字符和拓展8位255个字符

    2、ansi字符集,集合的集合:本意是本地字符集,里面包含各国家地区的字符集,如大陆的gbk,台湾的big5等

    3、iso-8859字符集,集合的集合:包含了国际标准化组织对各地的字符集的定义,有latin-1到Latin-12及Tail等字符集

    4、unicode字符集:包含世界各地主要字符原子的集合

字符编码:字符如何存储,使用几个字节进行编码;分为单字节编码,双字节编码,多字节编码;

    1、单字节编码SBCS:7bit的ascii编码,iso-8859-1编码

    2、双字节编码DBCS:

    3、多字节编码MBCS:utf8等变字节

或者按照字符集进行编码:

    1、ascii编码:iso-8859-1

    2、ansi编码:gb2312等

    3、unicode编码:utf8,16,32等

猜你喜欢

转载自blog.csdn.net/shyrainxy/article/details/112765215