python快速读取非常大的文件

其他 2018-05-30 05:17:16 阅读次数: 0

读取大文件是我们平时经常会遇到的问题，我这里给出两个比较好的解决方案。第一种

with open("test.txt") as f:
    for line in f:
        #do something with data

这种做法非常的简单。这个代码在打开文件的过程中，不会一次性读取全部文件，而是采用每次读取一行的方式，类似于buffer机制。

当然我们也可以自己去实现一个buffer，然后通过协程的方式操作

def readInChunks(fileObj, chunkSize=4096):
    """
    Lazy function to read a file piece by piece.
    Default chunk size: 4kB.
    """
    while 1:
        data = fileObj.read(chunkSize)
        if not data:
            break
        yield data

f = open('bigFile')
for chuck in readInChunks(f):
    #do_something(chunk)
f.close()

这段代码中我们通过每次读取4k大小的数据，将所有文件读取完。

我对于一个3GB大小的数据进行了读取测试，分别用时如下：

28.54150631145376 s
28.522545760074877 s

两者所用时间差不多。

猜你喜欢

转载自blog.csdn.net/qq_17550379/article/details/80212131

python快速读取非常大的文件

java快速读取文本文件最后一行数据内容，文本文件非常大

【tkinter】python工具pyinstaller打包生成exe文件非常大的原因分析（openpyxl）openpyxl

python工具pyinstaller打包生成exe文件非常大的原因分析（openpyxl）openpyxl

Python 条形图与直方图有非常大的区别

TPS波动非常大

文件式快速读取

python快速读取excel

Python如何快速读取数据文件若干行

table的colspan非常大时的异常

loss非常大，直至nan

java快速读取大文件

git 上传了一个非常大的文件，删除文件

python快速读取大数据1

在python中如何快速读取存储量大的文件

php 快速读取文件夹下文件列表

快速读取内存文件-内存映射文件的方法

1-N中素数的个数（N非常大）

爬虫是个非常大的搜索引擎

Qt——软件设置参数文件快速读取

QT快速读取Excel

快速读取 C++

python中的当数据量非常大的时候，节省内存空间的设置方式------------------------生成器与迭代器详解，内附示例代码

DotSpatial对于PostGis的快速读取

使用 GPSD 快速读取 GPS 信息

R语言快速读取数据方法

CursorAdapter加载数据量非常大的时候，出现数据加载延迟

对非常大的两个数字求和——数字字符串求和

创建GPT磁盘可以使用一个分区非常大的容量

如何在PDF中创建非常大的页面的技能，你get了吗？

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)