pandas文件读取错误及解决办法

错误一:‘gbk’ codec can’t decode byte 0x98 in position 2: illegal multibyte sequence

报错代码:

data_path=r"G:\test.csv"
f = open(data_path)
res = pd.read_csv(f)
f.close()

错误解读:
Unicode的解码Decode错误(Error),以gbk编码的方式去解码(该字符串变成Unicode),但是此处通过gbk的方式,却无法解码(can’t decode )。“illegal multibyte sequence”意思是非法的多字节序列,即没法(解码)了。 此种错误,可能是要处理的字符串本身不是gbk编码,但是却以gbk编码去解码 。比如,字符串本身是utf-8的,但是却用gbk去解码utf-8的字符串,所以结果不用说,则必然出错。

.解决办法:rb读取

data_path=r"G:\test.csv"
f = open(data_path,'rb')
res = pd.read_csv(f)
f.close()

错误二:Initializing from file failed

报错代码:pd.read_csv(r"G:\文件名.csv")

错误解读:文件初始化失败;即:文件路径或者文件名中存在中文,pd.read_csv()需要通过open的方式打开再进行读取

data_path=r"G:\test.csv"
f = open(data_path)
res = pd.read_csv(f)
f.close()

错误三:UnicodeDecodeError:

‘gbk’ codec can’t decode byte 0xd7 in position 99413: illegal multibyte sequence

问题解读:gbk”编解码器无法解码位置99413中的字节0xd7:非法的多字节序列,通常是比较大的文件会出现一些无关紧要的字码解码不出来

解决办法:

data_path=dir_path_order+'\\'+wj_name  #获取数据路径
f=open(data_path,encoding='gbk',errors='ignore')#部分文件有字节编码错误,errors 忽略
data=pd.read_csv(f)
f.close

错误四:部分带公式的Excel读不出来

解决办法:请移步之前文章,链接如下:

1、https://blog.csdn.net/qq_35866846/article/details/102672342
2、https://blog.csdn.net/qq_35866846/article/details/102775288

发布了35 篇原创文章 · 获赞 35 · 访问量 2592

猜你喜欢

转载自blog.csdn.net/qq_35866846/article/details/103487134