pandas文件读取错误及解决办法 - 代码天地

pandas文件读取错误及解决办法

其他 2020-01-15 22:51:33 阅读次数: 0

错误一：‘gbk’ codec can’t decode byte 0x98 in position 2: illegal multibyte sequence

报错代码：

data_path=r"G:\test.csv"
f = open(data_path)
res = pd.read_csv(f)
f.close()

错误解读：
Unicode的解码Decode错误（Error），以gbk编码的方式去解码（该字符串变成Unicode），但是此处通过gbk的方式，却无法解码（can’t decode ）。“illegal multibyte sequence”意思是非法的多字节序列，即没法（解码）了。此种错误，可能是要处理的字符串本身不是gbk编码，但是却以gbk编码去解码。比如，字符串本身是utf-8的，但是却用gbk去解码utf-8的字符串，所以结果不用说，则必然出错。

.解决办法：rb读取

data_path=r"G:\test.csv"
f = open(data_path,'rb')
res = pd.read_csv(f)
f.close()

错误二：Initializing from file failed

报错代码：pd.read_csv(r"G:\文件名.csv")

错误解读：文件初始化失败；即：文件路径或者文件名中存在中文，pd.read_csv()需要通过open的方式打开再进行读取

data_path=r"G:\test.csv"
f = open(data_path)
res = pd.read_csv(f)
f.close()

错误三：UnicodeDecodeError:

‘gbk’ codec can’t decode byte 0xd7 in position 99413: illegal multibyte sequence

问题解读：gbk”编解码器无法解码位置99413中的字节0xd7:非法的多字节序列，通常是比较大的文件会出现一些无关紧要的字码解码不出来

解决办法：

data_path=dir_path_order+'\\'+wj_name  #获取数据路径
f=open(data_path,encoding='gbk',errors='ignore')#部分文件有字节编码错误，errors 忽略
data=pd.read_csv(f)
f.close

错误四：部分带公式的Excel读不出来

解决办法：请移步之前文章，链接如下：

1、https://blog.csdn.net/qq_35866846/article/details/102672342
2、https://blog.csdn.net/qq_35866846/article/details/102775288

诡途

发布了35 篇原创文章 · 获赞 35 · 访问量 2592

私信关注

猜你喜欢

转载自blog.csdn.net/qq_35866846/article/details/103487134

pandas文件读取错误及解决办法

pandas读取大文件时memoryerror的解决办法

Python 读取文件错误解决办法

python文件读取：遇见的错误及解决办法

Pandas读取路径或文件名称包含中文的文件时报错及解决办法

python pandas.read_csv()读取csv文件，第一列数据作为index(索引)的解决办法

OpenCV imread()图片读取错误解决办法大全

pandas21读csv文件read_csv错误解决办法7种（详细 tcy）

【Pandas】SettingWithCopyWarning解决办法

hadoop读取hdfs文件中的中文乱码解决办法

[转]文件或目录损坏且无法读取的解决办法

文件或目录损坏且无法读取解决办法

file_get_contents无法读取文件的解决办法

文件或目录损坏且无法读取的解决办法（集合）

文件或目录损坏且无法读取的解决办法

当用pandas 读取excel数据出现Initializing from file failed的异常时的解决办法

python中pandas.read_csv()不能读取中文路径解决办法

pandas DataFrame 写入excel是列表读取变字符串的解决办法

CHM文件出现的常见错误及解决办法

autocad 文件错误，过大的原因分析和解决办法

word在试图打开文件时遇到错误，解决办法

word在试图打开文件时遇到错误的解决办法

Android Studio-R文件错误的解决办法

Oracle错误及解决办法

pandas 读取文件常见错误

关于【finder不能完成该操作因为未能读取或写入"文件名"中的某些数据(错误代码-36)】快速解决办法

hadoop错误解决办法:-------HDFS上传文件保存错误或速度很慢

Pandas读取文件的OSError: Initializing from file failed错误解决

nodejs 读取文件中文乱码 utf8转gbk解决办法

删除操作，提示“无法读取源文件或磁盘”，解决办法！

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)