Python中的编码和解码

python3 默认的编码是unicode,加载在内存中的数据就是用的Unicode,保存在硬盘和网络传输的时候用的是utf-8或者GBK

由unicode转换成别的格式需要使用encode(a)函数编码,a为转换后的目标格式,比如转成UTF-8,str.encode('UTF-8')

相反,解码需要decode(a)函数,a为转换前的目标格式,比如由UTF-8解码成unicode:b.decode('UTF-8')

需要注意的是,字符串在Unicode格式时作为字符集,编码之后变成了bytes形式,比如b'\xe4\xb8\xad',这是一个汉字的UTF-8的bytes表现形式

猜你喜欢

转载自www.cnblogs.com/DoingBe/p/9299964.html