解决UnicodeEncodeError

在使用python写入从网页下载下来的网页内容时,总会遇到这个错误:

UnicodeEncodeError: 'gbk' codec can't encode character '\xc2' in position 4069: illegal multibyte sequence

在windows下面,新文件的默认编码是gbk,这样的话,python解释器会用gbk编码去解析我们的网络数据流txt,然而txt此时已经是decode过的unicode编码,这样的话就会导致解析不了,出现上述问题。 解决的办法就是,改变目标文件的编码:

f = open("a.html","w",encoding='utf-8')  

猜你喜欢

转载自blog.csdn.net/L_longqihang/article/details/80632369