py3学习-----编码格式简介

ascii:英文8位一个字节;

unicode:英文32位四个字节;中文32位四个字节;

utf-8:英文8位一个字节;中文24位三个字节;

gbk:英文8位一个字节;中文16位两个字节;

1.各个编码之间是二进制,相互不能识别,会产生乱码;

2.文件存储和传输不能使用unicode。可以使用utf-8,utf-16,gbk,gb2312,ascii等

py3中str在内存中使用unicode编码,与其他编码转换:

英文:str = 'aaa' #unicode编码

   str = b'aaa' #utf-8或者gbk等

中文:str = ‘中文’ #unicode编码

   str = '中文' #使用str.encode('utf-8').decode('utf-8')防止乱码

猜你喜欢

转载自www.cnblogs.com/zhenning-li/p/9846716.html