Python的read_csv()读取大文件问题解决 - 代码天地

Python的read_csv()读取大文件问题解决

其他 2018-11-15 10:10:56 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u012111465/article/details/84099312

通过普通的read_csv（）方式读取几个G的csv文件，耗时长，读不出，卡到电脑崩溃掉，结果。。。死机，强制重启。
千万别写成：

import pandas as pd
merge_dt = pd.read_csv( cwd + '\\' + SaveFile_Path + '\\' + SaveFile_Name, encoding="utf_8", engine='python'  )

此时，可以利用read_csv（）中分块读取文件的功能，有两种方法解决该问题。

方法一

指定参数iterator = True返回一个可迭代对象TextFileReader ：

# 读取融合的CSV文件
merge_dt = pd.read_csv( cwd + '\\' + SaveFile_Path + '\\' + SaveFile_Name, encoding="utf_8", engine='python' ,iterator = True ) 
merge_dt  
# output: <pandas.io.parsers.TextFileReader at 0x1cc1f0a7470>
# 调用数据
merge_data = merge_dt.get_chunk(10000)

方法二

参数chunksize，通过指定一个chunksize分块大小来读取文件，也可返回一个可迭代的对象TextFileReader。

# 读取融合的CSV文件
merge_dt = pd.read_csv( cwd + '\\' + SaveFile_Path + '\\' + SaveFile_Name, encoding="utf_8", engine='python' , chunksize = 10) 
merge_dt  
# output: <pandas.io.parsers.TextFileReader at 0x1cc34ccd2e8>
# 通过以下方式调用数据
merge_data = merge_dt.get_chunk(1000)

猜你喜欢

转载自blog.csdn.net/u012111465/article/details/84099312

Python的read_csv()读取大文件问题解决

python 使用read_csv读取 CSV 文件时报错

python pandas 中文件的读写——read_csv（）读取文件

pandas读取文件的read_csv()

python3读取中文路径的csv文件（read_csv）处理方法

Python学习——csv文件读取：read_csv（）基本参数应用

Python Pandas DataFrame 读取 CSV 文件 read_csv 参数详解

Python常用的读取文件的方式（read_csv，read_table）

Pandas读取文件（read_csv与read_table 的区别）

【Pandas】read_csv读取文件函数详解

Pandas read_csv 少读取一列的问题

python read_csv 使用

Python csv文件空行问题解决

python用read_csv导入txt文件时的数据丢失问题

python文件的读写read_csv常用参数

python读取CSV文件以及“写入CSV致文件每一行后面会多一个空行”问题解决

pandas 排序（sort_values）；读取csv文件 read_csv

pandas read_csv read_txt 读取文件报错 OSError: Initializing from file failed

Python文件读取路径问题解决方案

pandas使用read_csv函数读取文件最后N行数据并保留表头、pandas使用read_csv函数读取网络url链接数据

【Python】详解 Pandas 中的 read_csv()

Pandas read_csv 无法读取文件无法找到文件路径FileNotFoundError: [Errno 2] No such file or directory

pandas.read_csv分块读取大文件

pandas.read_csv——分块读取大文件

大文件rosbag播放太慢问题解决

pandas的read_csv（）函数读取的文件路径找不到报错

python to_csv和read_csv索引加入内容的问题

读取大文件CSV

read_csv 函数

[pandas] read_csv()

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)