版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_27283619/article/details/88854886
Python3读取大文件的方法
1. 方法一:利用yield生成器
def readPart(filePath, size=1024, encoding="utf-8"):
with open(filePath,"r",encoding=encoding) as f:
while True:
part = f.read(size)
if part:
yield part
else:
return None
filePath = r"filePath"
size = 2048 # 每次读取指定大小的内容到内存
encoding = 'utf-8'
for part in readPart(filePath,size,encoding):
print(part)
# Processing data
2. 方法二:利用open()自带方法生成迭代对象,这个是一行一行的读取
with open(filePath) as f:
for line in f:
print(line)
# Processing data
3. 二者的比较
方法一可以灵活控制一次读取的size,在速度上较2有优势,适用于一些大的二进制文件,比如读取一些大的视频或者图片等。
方法二在处理一些文本的时候感觉更加便利,按行读更容易对文本进行处理。
关于两种方法的应用场景,欢迎小伙伴评论留言。