生成的数据集，csv文件列数不同，无法正常读取的解决方法 - 代码天地

生成的数据集，csv文件列数不同，无法正常读取的解决方法

其他 2022-01-08 13:28:39 阅读次数: 0

遇到的问题

由于自己读写文件操作生成的csv格式的数据集，每行的数据长度不一致，导致用pandas读取数据时候报错:
pandas.errors.ParserError: Error tokenizing data. C error: Expected 55 fields in line 5, saw 73
很是心烦，网上查了很久之后找到了大神分享的方法，记录一下！

代码如下

import pandas as pd
csv_file = "../datasets/features/dataset.csv"
largest_column_count =0
with open(csv_file, 'r') as temp_f:
    lines = temp_f.readlines()
    for l in lines:
        column_count = len(l.split(',')) + 1
        largest_column_count = column_count if largest_column_count < column_count else largest_column_count
temp_f.close()
# 这里可以直接定义你想要的列数就可以了（由于我的数据集列数千万级别，有点大，自己尝试了一下直接定义largest_column_count）
column_names = [i for i in range(0, largest_column_count)]

data = pd.read_csv("../datasets/features/dataset.csv", header=None, delimiter=',', names=column_names)

该方法原文链接

https://blog.csdn.net/Kyrie_10/article/details/117367220

猜你喜欢

转载自blog.csdn.net/u011253318/article/details/122377473

生成的数据集，csv文件列数不同，无法正常读取的解决方法

pandas读取列数不同的CSV文件

【解决】csv文件数据集集中在一列

[Python]读取csv文件OSError解决方法

csv文件记事本打开正常excel打开是科学计数法的解决方法

iReport - 无法正常启动的解决方法

github无法正常访问的解决方法

"文件或目录损坏且无法读取"问题的解决方法

【生成数据集csv文件，第一列为路径，第二列为label】

python pandas.read_csv()读取csv文件，第一列数据作为index(索引)的解决办法

Spring Batch读取csv文件失败的一种解决方法

CSV文件乱码的解决方法

从csv文件读取列数据保存在列表中

使用Csvhelper读取CSV文件某行某列数据

织梦后台管理模板无法正常显示模板文件列表解决方法

虚拟机文件无法正常打开的解决方法

【转载】任务计划无法正常运行批处理文件的解决方法

关于devc++无法正常运行exe文件的解决方法

ElementUI使用本地CDN时文件图标字体无法正常显示的解决方法

BLE无法正常回调onServicesDiscovered方法解决方法

oracle9i的erp数据库无法正常关闭的解决方法。

远程linux数据库时无法正常连接的解决方法

Linux数据盘扩容时，磁盘挂载后，无法正常卸载的解决方法

pandas读取csv常见错误及解决方法

读取csv文件方法

PHP 读取或生成Unicode csv文件（PHP读取淘宝CSV文件出现乱码解决方案）

Tensorflow 读取Txt和Csv格式数据+Iris数据集CSV格式文件读取

ztree 添加节点的图标无法正常显示解决方法

SecureCRT无法使用root正常连接Ubuntu解决方法

Anaconda navigator闪退、无法正常启动的解决方法

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)