python的字符编码问题

1、大名鼎鼎的utf8(unicode编码子集)

             在python的开头我们一般会写上#-*-encoding=utf-8-*它的意思是该文件将用utf-8的编码方式打开,所以我们的文件将用utf-8编码。但是为什么有时候我们的中文会输出\xe6\x88\x91这种玩意。这到底是什么呢?其实他就是utf8编码。


2、明确字符编码互转需要通过Unicode编码

           两个函数派上场decode和encode函数。比如‘中国’假设他的编码是GBK,那我要将他转成UTF8,我们就可以通过‘中国’.decode('GBK')将它用GBK解码为unicode。然后再通过encode将它编码为utf8。



猜你喜欢

转载自blog.csdn.net/ecnu18918079120/article/details/77537449