python--编码问题

1、ASCii 占用一个字节,只支持英文

2、GB2312 占用2个字节,支持6700+ 汉字

3、GBK 升级版的2312   支持21000+汉字

4、unicode 2-4字节,

(1)、支持全球所有语言,编码统一

(2)、包含和全球所有各自的编码的映射关系

本地使用使用unicode没问题,因为本地计算机内存大,不care。但存储和网络传输时数据一多,占用多了一倍就有问题了

为了解决这个问题,UTF就诞生了,既对unicode的转换

utf-8 可变长编码,使用1-4个字符,英文是1个字符,欧洲2个字节,中文3个字节,其余特殊的就是4个字节

猜你喜欢

转载自www.cnblogs.com/LoveElsa/p/10227034.html
今日推荐