已解决UnicodeEncodeError: ‘utf-8‘ codec can‘t encode character ‘\udf76‘ in position 32: surrogates not

已解决UnicodeEncodeError: ‘utf-8’ codec can’t encode character ‘\udf76’ in position 32: surrogates not allowed









报错代码



粉丝群里面的一个小伙伴想用python把文件写入txt中,但是发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错代码如下:


# 保存结果
with open(out_path, 'w', encoding='utf8') as f:
     f.writelines([word + '\t' + file_name + '\n' for count, py, word, file_name in GTable])

报错信息截图


在这里插入图片描述




报错翻译



报错信息翻译

Unicode编码错误:“utf-8”编解码器无法对位置32中的字符“\udf76”进行编码:不允许代理项




报错原因



报错原因

一些字符串无法被utf-8解码,所以可以把无法转化为utf-8格式的字符‘ignore’掉,再进行解码。




解决方法



遇到这种报错在字符串后面加上如下代码即可:

.encode('UTF-8', 'ignore').decode('UTF-8')

修改写入代码即可:
# 保存结果
with open(out_path, 'w', encoding='utf-8') as f:
    try:
        f.writelines([word + '\t' + file_name + '\n' for count, py, word, file_name in GTable])
    except:
        f.writelines([word.encode('UTF-8', 'ignore').decode('UTF-8') + '\t' + file_name.encode('UTF-8', 'ignore').decode('UTF-8') + '\n' for count, py, word, file_name in GTable])

再次写入就成功了!


帮忙解决

本文已收录于:《告别Bug》专栏

本专栏用于记录学习和工作中遇到的各种疑难Bug问题,以及粉丝群里小伙伴提出的各种问题,文章形式:报错代码 + 报错翻译 + 报错原因 + 解决方法,包括程序安装、运行程序过程中等等问题,订阅专栏+关注博主后如遇到其他问题可私聊帮忙解决!!!

猜你喜欢

转载自blog.csdn.net/yuan2019035055/article/details/126582909