Python3读取大文件的方法

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_27283619/article/details/88854886

1. 方法一:利用yield生成器

def readPart(filePath, size=1024, encoding="utf-8"):
    with open(filePath,"r",encoding=encoding) as f:
        while True:
            part = f.read(size)  
            if part:
                yield part
            else:
                return None
filePath = r"filePath"
size = 2048 # 每次读取指定大小的内容到内存
encoding = 'utf-8'
for part in readPart(filePath,size,encoding):
    print(part)
    # Processing data

2. 方法二:利用open()自带方法生成迭代对象,这个是一行一行的读取

with open(filePath) as f:
    for line in f:
        print(line)
        # Processing data

3. 二者的比较

方法一可以灵活控制一次读取的size,在速度上较2有优势,适用于一些大的二进制文件,比如读取一些大的视频或者图片等。
方法二在处理一些文本的时候感觉更加便利,按行读更容易对文本进行处理。
关于两种方法的应用场景,欢迎小伙伴评论留言。

猜你喜欢

转载自blog.csdn.net/qq_27283619/article/details/88854886