已解决UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\u0157’ in position 1: illegal multibyte sequence

文章目录

报错代码
报错翻译
报错原因
解决方法
帮忙解决

报错代码

粉丝群里面的一个小伙伴想用python把文件写入txt中，但是发生了报错（当时他心里瞬间凉了一大截，跑来找我求助，然后顺利帮助他解决了，顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴），报错代码如下：：

# 保存结果
with open(out_path, 'w', encoding='gbk') as f:
     f.writelines([word + '\t' + file_name + '\n' for count, py, word, file_name in GTable])

报错信息如下：

Traceback (most recent call last):
  File "E:/Python/test3.py", line 140, in <module>
    f.writelines([word + '\t' + file_name + '\n' for count, py, word, file_name in GTable])
UnicodeEncodeError: 'gbk' codec can't encode character '\u0157' in position 1: illegal multibyte sequence

报错翻译

报错信息翻译：

Unicode编码错误：“gbk”编解码器无法对位置1中的字符“\u0157”进行编码：非法的多字节序列

报错原因

报错原因：

一些字符串无法被gbk解码，所以可以把无法转化为gbk格式的字符‘ignore’掉，再进行解码。

解决方法

遇到这种报错在字符串后面加上如下代码即可：

.encode('gbk', 'ignore').decode('gbk')

修改写入代码即可：

# 保存结果
with open(out_path, 'w', encoding='gbk') as f:
    try:
        f.writelines([word + '\t' + file_name + '\n' for count, py, word, file_name in GTable])
    except:
        f.writelines([word.encode('UTF-8', 'ignore').decode('UTF-8') + '\t' + file_name.encode('gbk', 'ignore').decode('gbk') + '\n' for count, py, word, file_name in GTable])

再次写入就成功了！

帮忙解决

本文已收录于：《告别Bug》专栏

本专栏用于记录学习和工作中遇到的各种疑难Bug问题，以及粉丝群里小伙伴提出的各种问题，文章形式：报错代码 + 报错翻译 + 报错原因 + 解决方法，包括程序安装、运行程序过程中等等问题，订阅专栏+关注博主后如遇到其他问题可私聊帮忙解决！！！

已解决UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘ŗ‘ in position 1: illegal multibyte