pandas读取大文件时memoryerror的解决办法 - 代码天地

pandas读取大文件时memoryerror的解决办法

其他 2018-10-19 18:18:22 阅读次数: 0

再用pd.read_csv读取大文件时，如果文件太大，会出现memoryerror的问题。

解决办法一：pd.read_csv的参数中有一个chunksize参数，为其赋值后，返回一个可迭代对象TextFileReader，对其遍历即可

reader = pd.read_csv(file_path, chunksize=20)　　# 每次读取20条数据

 1 import pandas as pd 
 2 
 3 def knn():
 4     # 读取数据
 5     file_path = './facebook/train.csv'
 6     
 7     reader = pd.read_csv(file_path, chunksize=20)    # 每块为20条数据(index)
 8 
 9     for chunk in reader:
10         print(chunk)
11         break
12 
13 if __name__ == '__main__':
14     knn()

代码执行结果如下：

解决办法二：pd.read_csv的参数中有一个iterator参数，默认为False，将其改为True，返回一个可迭代对象TextFileReader，使用它的get_chunk(num)方法可获得前num行的数据

import pandas as pd 

def knn():
    '''完成k近邻算法'''

    # 读取数据
    file_path = './facebook/train.csv'

    reader = pd.read_csv(file_path, iterator=True)
    chunk = reader.get_chunk(5)    # 获取前5行数据
    print(chunk)


if __name__ == '__main__':
    knn()

代码执行结果如下：

猜你喜欢

转载自www.cnblogs.com/shuaishuaidefeizhu/p/9817872.html

pandas读取大文件时memoryerror的解决办法

pandas文件读取错误及解决办法

php优化！！！读取大文件时只读取一部分的解决办法

已解决Python读取20GB超大文件内存溢出报错MemoryError

当用pandas 读取excel数据出现Initializing from file failed的异常时的解决办法

springboot上传大文件时内存溢出的可能解决办法

Pandas读取路径或文件名称包含中文的文件时报错及解决办法

通过Pandas读取大文件

用pandas读取大文件

pcl读取pcd文件时，编译时出现pcl::io中断，解决办法如文。

关于.NET C#上传大文件的解决办法

NFS拷贝大文件出错的解决办法

Java超大文件上传解决办法

cgi+lighttpd上传大文件失败解决办法

大文件快速传输解决办法汇总

Excel大文件时读取内存溢出的解决方案

python读取文件时出现多行空行或者空格的解决办法

ubuntu 挂载硬盘时，只能读取文件，不能写入的解决办法

使用Pandas库时显示不全（省略）的解决办法

pandas 使用chunkSize 读取大文件

pandas读取tsv大文件(GB)方法

python pandas.read_csv()读取csv文件，第一列数据作为index(索引)的解决办法

PHP 上传大文件时，就算在php.ini中设置好了上传文件的大小，足够文件上传，但仍提示Internet server error的解决办法

【Pandas】SettingWithCopyWarning解决办法

调用list(itertools.combinations(keys,3))出现MemoryError的解决办法

python读取txt文件时，报错【utf-8 codec cant decode byte 0xcc】的解决办法

Python 读取文件错误解决办法

hadoop读取hdfs文件中的中文乱码解决办法

[转]文件或目录损坏且无法读取的解决办法

python文件读取：遇见的错误及解决办法

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)