第一步 排除文件打开方式错误:
r只读,r+读写,不创建
w新建只写,w+新建读写,二者都会将文件内容清零
(以w方式打开,不能读出。w+可读写)
w+与r+区别:
r+:可读可写,若文件不存在,报错;w+: 可读可写,若文件不存在,创建
r+与a+区别:
- fd = open("1.txt",'w+')
- fd.write('123')
- fd = open("1.txt",'r+')
- fd.write('456')
- fd = open("1.txt",'a+')
- fd.write('789')
结果:456789
说明r+进行了覆盖写。
以a,a+的方式打开文件,附加方式打开
(a:附加写方式打开,不可读;a+: 附加读写方式打开)
以 'U' 标志打开文件, 所有的行分割符通过 Python 的输入方法(例#如 read*() ),返回时都会被替换为换行符\n. ('rU' 模式也支持 'rb' 选项) .
r和U要求文件必须存在
不可读的打开方式:w和a
若不存在会创建新文件的打开方式:a,a+,w,w+
- >>> fd=open(r'f:\mypython\test.py','w') #只读方式打开,读取报错
- >>> fd.read()
- Traceback (most recent call last):
- File "<stdin>", line 1, in <module>
- IOError: File not open for reading
- >>> fd=open(r'f:\mypython\test.py','a')#附加写方式打开,读取报错
- >>> fd.read()
- Traceback (most recent call last):
- File "<stdin>", line 1, in <module>
- IOError: File not open for reading
- >>></span></span></span>
- >>> fd=open(r'f:\mypython\test.py','a+')
- >>> fd.write('123')
- >>> fd.read()
- >>> fd.close()
原因分析:指针问题。open()以a+模式开启了一个附加读写模式的文件,由于是a,所以指针在文件末尾。此时如果做read(),则Python发现指针位置就是EOF,读取到空字符串。
在写入123之后,指针的位置是4,仍然是文件尾,文件在内存中是123[EOF]。
但看起来read()的时候,Python仍然去试图在磁盘的文件上,将指针从文件头向后跳3,再去读取到EOF为止。
也就是说,你实际上是跳过了该文件真正的EOF,为硬盘底层的数据做了一个dump,一直dump到了一个从前存盘文件的[EOF]为止。所以最后得到了一些根本不期待的随机乱字符,而不是编码问题造成的乱码。
解决方案:读取之前将指针重置为文件头(如果读取之后重置再读,无效)
- >>> fd=open(r'f:\mypython\test.py','a+')
- >>> fd.seek(0)
- >>> fd.read()
- '123'<span style="white-space:pre"> </span>#顺利读出</span></span>
- >>> fd=open(r'f:\mypython\test.py','w+') #清空内容,重新写入
- >>> fd.write('456')
- >>> fd.flush()<span style="white-space:pre"> </span>#确定写入,此时文件内容为“456”
- >>> fd.read()
- '' #读出空
解决方案一、调用close后重新打开,指针位于开头。(r,r+,a+,U都可以,注意不要用w,w+,a打开)
- >>> fd.close()
- >>> fd=open(r'f:\mypython\test.py','a+')
- >>> fd.read()
- '456'
- >>> fd.close()
- >>> fd=open(r'f:\mypython\test.py','r+')
- >>> fd.read()
- '456'<pre name="code" class="python">>>> fd.close()
- >>> fd=open(r'f:\mypython\test.py','r')
- >>> fd.read()
- '456'
- >>> fd.close()
- >>> fd=open(r'f:\mypython\test.py','U')
- >>> fd.read()
- '456'
- >>> fd=open(r'f:\mypython\test.py','w+')
- >>> fd.write('456')
- >>> fd.seek(0)
- >>> fd.read()
- '456'
seek函数
seek(offset[, whence]) ,offset是相对于某个位置的偏移量。位置由whence决定,默认whence=0,从开头起;whence=1,从当前位置算起;whence=2相对于文件末尾移动,通常offset取负值。
4. 记得close()关闭
当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了。所以,还是用with语句来得保险:
with open('/Users/michael/test.txt', 'w') as f:
f.write('Hello, world!')
@@@@@这打开一个文件的不同模式的列表@@@@@@
模式 | 描述 |
---|---|
r | 打开一个文件为只读。文件指针置于该文件的开头。这是默认模式。 |
rb | 打开一个文件只能以二进制格式读取。文件指针置于该文件的开头。这是默认模式。 |
r+ | 打开用于读取和写入文件。文件指针将会在文件的开头。 |
rb+ | 打开用于读取和写入二进制格式的文件。文件指针将会在文件的开头。 |
w | 打开一个文件只写。覆盖该文件,如果该文件存在。如果该文件不存在,则创建用于写入一个新的文件。 |
wb | 打开一个文件只能以二进制格式写入。覆盖该文件,如果该文件存在。如果该文件不存在,则创建用于写入一个新的文件。 |
w+ | 打开用于写入和读取的文件。覆盖现有的文件,如果文件存在。如果该文件不存在,则创建读取和写入新的文件。 |
wb+ | 打开用于写入和读取的二进制格式的文件。覆盖现有的文件,如果文件存在。如果该文件不存在,则创建读取和写入新的文件。 |
a | 将打开追加文件。文件指针是在文件的结尾。也就是说,该文件是在附加模式。如果该文件不存在,它创造了写入一个新的文件。 |
ab | 将打开追加的二进制格式的文件。文件指针在该文件的结束。也就是说,该文件为追加模式。如果该文件不存在,它创建并写入一个新的文件。 |
a+ | 打开为追加和读取文件。文件指针在该文件的结束。该文件将为追加模式。如果该文件不存在,它创建并读取和写入的新文件。 |
ab+ | 打开两个追加和读取的二进制格式的文件。文件指针在该文件的结束。该文件将在追加模式。如果该文件不存在,它创建并读取和写入的新文件。 |
关闭文件用close:
一个文件对象的close()方法刷新未写入的信息,并关闭该文件的对象,在这之后没有数据内容可以执行写入。
写入文件用write:
write()方法写入字符串到任何一个打开的文件。要注意的是Python字符串可以具有二进制数据,而不仅仅是文字。
读取文件用read:
read()方法读取一个打开的文件的字符串。要注意的是Python字符串可以具有二进制数据,而不仅仅是文本。
需要注意的是:由于缓冲,字符串可能实际上没有出现在该文件中,直到调用flush()或close()方法被调用.
一般的文件流操作都包含缓冲机制,write方法并不直接将数据写入文件,而是先写入内存中特定的缓冲区。
flush方法是用来刷新缓冲区的,即将缓冲区中的数据立刻写入文件,同时清空缓冲区。
正常情况下缓冲区满时,操作系统会自动将缓冲数据写入到文件中。
至于close方法,原理是内部先调用flush方法来刷新缓冲区,再执行关闭操作,这样即使缓冲区数据未满也能保证数据的完整性。
如果进程意外退出或正常退出时而未执行文件的close方法,缓冲区中的内容将会丢失。