1.打开文件
读写文件是常见的IO操作,Python内置了读写文件的函数,方便了文件的IO操作。
文件读写之前需要打开文件,确定文件的读写模式。open函数用来打开文件,语法如下:
open(name, [mode, [buffering]])
open函数使用一个文件名作为唯一的强制参数,然后返回一个文件对象。模式(mode)和缓冲区(buffering)参数都是可选的,默认模式为读模式,默认缓冲区是无。
假设当前工作目录下有个叫example.txt
的文本文件,其存储路径是’c:/temp’(或Linux下的’~/temp’),那么可以像下面这样打开文件。在交互式环境的提示符">>>"下,输入如下内容:
>>> f = open(r'c:\temp\example.txt')
如果文件不存在,将会看到一个类似下面的异常回溯:
Traceback (most recent call last)
File “<stdio>”, line 1, in <module>
IOError:[Error 2] No such file or directory: 'C:\\example.txt'
2.文件模式
下面主要说一下open函数中的mode参数(如下表所示),通过改变mode参数可以实现对不同文件的不同操作。
open函数中mode参数
值 | 功能描述 |
---|---|
‘r’ | 读模式 |
‘w’ | 写模式 |
‘a’ | 追加模式 |
‘b’ | 二进制模式(可添加到其他模式中使用) |
‘+’ | 读/写模式(可添加到其他模式中使用) |
这里主要提醒一下'b'
参数的使用,一般处理文本文件时,是用不到'b'
参数的但是处理一些其他类型的文件(二进制文件),比如mp3音乐或者图像,那么应该在模式参数中增加'b'
,这在爬虫中处理媒体文件很常用。参数'rb'
可以用来读取一个二进制文件。
3.文件缓冲区
open函数中第三个可选参数buffering控制着文件的缓冲。如果参数是0,I/O操作就是无缓冲的,直接将数据写在硬盘上;如果参数是1,I/O操作就是有缓冲的,数据先写到内存里只有使用flush或者close函数时才会将数据更新到硬盘;如果参数为大于1的数字则代表缓冲区的大小(单位是字节),-1(或者是任何负数)代表使用默认缓冲区的大小。
4.文件读取
文件读取主要是分为按字节读取和按行读取,经常用到的方法有read()、readlines()、close()。
在">>>"输入f = open(r'c:\temp\example.txt')
后,如果成功打开文本文件,接下来调用read()方法则可以一次性将文件内容全部读到内存中,最后返回的是str类型的对象:
>>> f.read()
'人生苦短,我用Python'
最后一步调用close(),可以关闭对文件的引用。文件使用完毕后必须关闭,因为使用完毕后必须关闭,因为文件对象会占用操作系统资源,影响系统的IO操作。
>>> f.close()
由于文件操作可能会出现IO异常,一旦出现IO异常,后面的close()方法就不会调用。所以为了保证程序的健壮性,我们需要使用try…finally来实现。
try:
f = open(r'c:\temp\example.txt', 'r')
print(f.read())
finally:
if f:
f.close()
上面的代码略长,Python提供了一种简单的写法,使用with语句来替代try…finally代码块和close() 方法,如下所示:
with open(r'c:\temp\example.txt', 'r') as filereader:
for line in filereader.readlines():
print(line.strip())
5.文件读写
写文件和读文件是一样的,唯一的区别实在调用open方法时,传入标识'w'
或者'wb'
表示写入文本文件或者写入二进制文件,实例如下:
f = open(r'c:\temp\example.txt', 'w')
f.write('人生苦短,我用Python')
f.close()
我们可以反复调用write()方法写入文件,最后必须使用close()方法来关闭文件。使用write()方法的时候,操作系统不是立即将数据写入文件中,而是先写入内存中缓存起来,等空闲的时候再写入文件中,最后使用close()方法就将数据完整的写到文件中了。当然也可以使用f.flush()
方法,不断将数据立即写入文件中,最后使用close()
方法来关闭文件。和读文件同样道理,文件操作中可能会出现IO异常,所以还是推荐with语句:
with open(r'c:\temp\example.txt', 'w') as fileWriter:
fileWriter.write('人生苦短,我用Python')