使用生成器读取一个超大文件 - 代码天地

使用生成器读取一个超大文件

其他 2019-12-16 23:34:08 阅读次数: 0

pyhon读取文件很方便,但是,如果文件很大,而且还是一行文件,那就蛋疼了. 不过还好有read(size)方法,这个方法就是每次读取size大小的数据到内存中

下面来个示例

def readlines(f, separator):
    '''
    读取大文件方法
    :param f:   文件句柄
    :param separator:   每一行的分隔符
    :return:
    '''
    buf = ''
    while True:
        while separator in buf:
            position = buf.index(separator)  # 分隔符的位置
            yield buf[:position]  # 切片, 从开始位置到分隔符位置
            buf = buf[position + len(separator):]  # 再切片,将yield的数据切掉,保留剩下的数据

        chunk = f.read(4096)  # 一次读取4096的数据到buf中
        if not chunk:  # 如果没有读到数据
            yield buf  # 返回buf中的数据
            break  # 结束
        buf += chunk  # 如果read有数据 ,将read到的数据加入到buf中


with open('text.txt',encoding='utf-8') as f:
    for line in readlines(f,'|||'):
        # 为什么readlines函数能够使用for循环遍历呢, 因为这个函数里面有yield关键字呀, 有它就是一个生成器函数 ......
        print(line)

测试文件text.txt

fgshfsljflsjfls|||fyhdiyfdfhn|||fudofdb钦铁杆jdlfdl|||tedsthfdskfdk

打印结果

fgshfsljflsjfls
fyhdiyfdfhn
fudofdb钦铁杆jdlfdl
tedsthfdskfdk

猜你喜欢

转载自www.cnblogs.com/z-qinfeng/p/12052007.html

使用生成器读取一个超大文件

生成器读取大文件应用

【python】生成器读取大文件

迭代器和生成器，使用生成器读取大文件

【8.5】生成器如何读取大文件

使用python写一个代码生成器

一个简单的订单生成器 ---- 20160920

一个简陋的代码生成器

一个简单的姓名生成器

一个全局ID生成器

一个java代码生成器的简单实现

生成器（自身就是一个迭代器）

jsdoc 一个JavaScript API文档生成器

SpookFlare一个loader-dropper生成器

实现一个电话号码生成器

自荐一个 element 表单代码生成器

APIDOC-推荐一个API生成器

一个简单实用的java代码生成器

读者推荐 · 一个美观的简历生成器

一个简单的短ID生成器

推荐一个静态博客生成器

IDEA使用Mybatis generator生成器，一个简单的实例

使用 Node.js 写一个代码生成器

微信小程序｜使用小程序制作一个节日祝福生成器

windows下删除一个超大文件夹

Snapde一个全新的CSV超大文件编辑软件

分享一个超大文件编辑器（WINDOWS 文本编辑器）

利用生成器制作一个简单的客户端接收文件的进度条

Python chunk读取超大文件

java逐行读取超大文件

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)