已解决UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘ŗ‘ in position 1: illegal multibyte

已解决UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\u0157’ in position 1: illegal multibyte sequence









报错代码



粉丝群里面的一个小伙伴想用python把文件写入txt中,但是发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错代码如下:


# 保存结果
with open(out_path, 'w', encoding='gbk') as f:
     f.writelines([word + '\t' + file_name + '\n' for count, py, word, file_name in GTable])

报错信息如下

Traceback (most recent call last):
  File "E:/Python/test3.py", line 140, in <module>
    f.writelines([word + '\t' + file_name + '\n' for count, py, word, file_name in GTable])
UnicodeEncodeError: 'gbk' codec can't encode character '\u0157' in position 1: illegal multibyte sequence




报错翻译



报错信息翻译

Unicode编码错误:“gbk”编解码器无法对位置1中的字符“\u0157”进行编码:非法的多字节序列




报错原因



报错原因

一些字符串无法被gbk解码,所以可以把无法转化为gbk格式的字符‘ignore’掉,再进行解码。




解决方法



遇到这种报错在字符串后面加上如下代码即可:

.encode('gbk', 'ignore').decode('gbk')

修改写入代码即可:
# 保存结果
with open(out_path, 'w', encoding='gbk') as f:
    try:
        f.writelines([word + '\t' + file_name + '\n' for count, py, word, file_name in GTable])
    except:
        f.writelines([word.encode('UTF-8', 'ignore').decode('UTF-8') + '\t' + file_name.encode('gbk', 'ignore').decode('gbk') + '\n' for count, py, word, file_name in GTable])

再次写入就成功了!


帮忙解决

本文已收录于:《告别Bug》专栏

本专栏用于记录学习和工作中遇到的各种疑难Bug问题,以及粉丝群里小伙伴提出的各种问题,文章形式:报错代码 + 报错翻译 + 报错原因 + 解决方法,包括程序安装、运行程序过程中等等问题,订阅专栏+关注博主后如遇到其他问题可私聊帮忙解决!!!

猜你喜欢

转载自blog.csdn.net/yuan2019035055/article/details/126582320