UnicodeDecodeError: 'utf-8' codec can't decode byte 0xce in position 52: invalid continuation byte

python调用pandas库打开csv文件时出现的
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xce in position 52: invalid continuation byte
可以看出出现的原因是Decode错误,也就是使用字符集‘utf-8’解码所打开文件内容时出现了无法解码的字符,同理,有时候编码也就是encode时也会出现无法编码的字符
解决办法的话,就是换一个字符集,我这边解决的时候换成了字符集‘ANSI’,当然可以换成其他的,如’ISO-8859-1
附上代码:
出错的代码

train_df = pd.read_csv('train.csv')

改完的代码:

train_df = pd.read_csv('train.csv', encoding='ANSI')
#也就是加个encoding参数

猜你喜欢

转载自blog.csdn.net/csdn_muxin/article/details/84450938