关于编码方式的小总结

ASCII编码:用来表示英文,它使用1个字节表示,其中第一位规定为0,其他7位存储数据,一共可以表示128个字符。

拓展ASCII编码:用于表示更多的欧洲文字,用8个位存储数据,一共可以表示256个字符

GBK/GB2312/GB18030:表示汉字。GBK/GB2312表示简体中文,GB18030表示繁体中文。用2个字节表示1个汉字

(GBK和GB2312都是针对简体字的编码,只是GB2312只支持六千多个汉字的编码,而GBK支持1万多个汉字编码。而GB18030是用于繁体字的编码)

Unicode编码:包含世界上所有的字符,是一个字符集。

UTF-8:是Unicode字符的实现方式之一,它使用1-4个字符表示一个符号,根据不同的符号而变化字节长度,1个汉字用3个字节表示

python2.X:编码方式:ASCII,若需在代码中输入输出中文,需在代码第一行加上“#-*- coding:utf-8 -*-”

python3.X:编码方式:uft-8,可直接对中文进行输入输出

猜你喜欢

转载自www.cnblogs.com/zmhx/p/10057200.html
今日推荐