关于python中decode和encode的一些理解

一般这两个通常用在爬取网页之后获得字符串上面,decode的意思是告诉程序你获取到的网页内容是由什么编码的,你需要加上decode告诉程序网页字符串的编码内容,然后程序可以正常进行解析,然后如果你要在程序里面进行查找特定字符串或者进行某些处理,并且如果网页字符串编码和当前代码的编码格式不同,需要先将网页内容编码转换为当前代码文件编码的格式,这里就用到了encode,正确的用法是str.decode().encode();通过这样的两次就可以转换为当前代码编码了,如果还是报错,那就在程序最前面加上

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

告诉程序当前代码编码是utf-8即可。

猜你喜欢

转载自blog.csdn.net/wang_ys121/article/details/78914278