《零基础入门学习Python》（28）--文件

前言

文件操作作为一个非常重要的学习部分，接下来我看看文件的相关操作

知识点

Python中使用open(...)这个内置函数来打开文件，并返回文件对象

open()函数参数说明：

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

file: 传入文件名，如果只有文件名（不带路径），Python会在当前文件夹里去查找这个文件并打开

mode: 文件打开模式，默认为r(读取)

文件打开模式表

打开模式	执行操作
'r'	以只读方式打开文件（默认）
'w'	以写入的方式打开文件，会覆盖已存在的文件
'x'	如果文件已经存在，使用此模式打开将引发异常
'a'	以写入模式打开，如果文件存在，则在末尾追加写入
'b'	以二进制模式打开文件
't'	以文本模式打开（默认）
'+'	可读写模式（可添加到其他模式中使用）
'U'	通用换行符支持

文件对象方法

序号   方法   说明
1   file.close()   关闭文件。关闭后文件不能再进行读写操作。
2   file.flush()   刷新文件内部缓冲，直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。
3   file.fileno()   返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。
4   file.isatty()   如果文件连接到一个终端设备返回 True，否则返回 False。
5   file.next()   返回文件下一行。
6   file.read([size])   从文件读取指定的字节数，如果未给定或为负则读取所有。
7   file.readline([size])   读取整行，包括 “\n” 字符。
8   file.readlines([sizeint])   读取所有行并返回列表，若给定sizeint>0，返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。
9   file.seek(offset[, whence])   设置文件当前位置
10   file.tell()   返回文件当前位置。
11   file.truncate([size])   从文件的首行首字符开始截断，截断文件为 size 个字符，无 size 表示从当前位置截断；截断之后 V 后面的所有字符被删除，其中 Widnows 系统下的换行代表2个字符大小。
12   file.write(str)   将字符串写入文件，没有返回值。
13   file.writelines(sequence)   向文件写入一个序列字符串列表，如果需要换行则要自己加入每行的换行符。

各方法详细说明

`file.close()`：

概述：

方法用于关闭一个已打开的文件。关闭后的文件不能再进行读写操作，否则会触发 ValueError: I/O operation on closed file.错误。 close()方法允许调用多次。

当 file 对象，被引用到操作另外一个文件时，Python 会自动关闭之前的 file 对象。使用 close() 方法关闭文件是一个好的习惯。

示例：

#!/usr/bin/python3

#打开文件

file1 = open('E:/test1.txt','wt')
print('文件名为：',file1.name)

#关闭文件
file1.close()

====输出结果====
文件名为： E:/test1.txt

`file.flush()`

概述

flush() 方法是用来刷新缓冲区的，即将缓冲区中的数据立刻写入文件，同时清空缓冲区，不需要是被动的等待输出缓冲区写入。

一般情况下，文件关闭后会自动刷新缓冲区，但有时你需要在关闭前刷新它，这时就可以使用 flush() 方法。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test1.txt','wt')
print('文件名为：',file1.name)

# 刷新缓冲区
file1.flush()

#关闭文件
file1.close()

====输出结果====
文件名为： E:/test1.txt

`file.fileno()`

概述

fileno() 方法返回一个整型的文件描述符(file descriptor FD 整型)，可用于底层操作系统的 I/O 操作。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test1.avi','wt')
print('文件名为：',file1.name)

fid = file1.fileno()
print('文件描述符为: ', fid)

#关闭文件
file1.close()

====输出结果====
文件名为： E:/test1.avi
文件描述符为:  3

`file.isatty()`

概述

isatty() 方法检测文件是否连接到一个终端设备，如果连接到一个终端设备返回 True，否则返回 False。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test1.avi','wt')
print('文件名为：',file1.name)

ret = file1.isatty()
print('返回值: ', ret)

#关闭文件
file1.close()

====输出结果====
文件名为： E:/test1.avi
返回值:  False

file.next()

概述

next(iterator[,default])

Python 3 中的 File 对象不支持 next() 方法。 Python 3 的内置函数 next() 通过迭代器调用 __next__()方法返回下一项。在循环中，next()方法会在每次循环中调用，该方法返回文件的下一行，如果到达结尾(EOF),则触发StopIteration

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为：',file1.name)

for each in range(1,7):
    line = next(file1)
    print("第 %d 行 - %s" % (each, line))

#关闭文件
file1.close()

===输出结果===
Traceback (most recent call last):
  File "D:/untitled/Python_learn/File_Test.py", line 9, in <module>
    line = next(file1)
StopIteration
文件名为： E:/test.txt
第 1 行 - 这是第一行

第 2 行 - 这是第二行

第 3 行 - 这是第三行

第 4 行 - 这是第四行

第 5 行 - 这是第五行

===输出结果===
文件名为： E:/test.txt
读取的字符串: 这是第一行
这是第二

file.read([size])

概述

read() 方法用于从文件读取指定的字节数，如果未给定或为负则读取所有。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为：',file1.name)

line = file1.read(10)
print("读取的字符串: %s" % (line))

#关闭文件
file1.close()
文链接！

`file.readline([size])`

概述

readline() 方法用于从文件读取整行，包括 “\n” 字符。如果指定了一个非负数的参数，则返回指定大小的字节数，包括 “\n” 字符。

示例

text.txt文件内容：
1:https://blog.csdn.net/wanbin6470398/
2:https://blog.csdn.net/wanbin6470398/
3:https://blog.csdn.net/wanbin6470398/
4:https://blog.csdn.net/wanbin6470398/
5:https://blog.csdn.net/wanbin6470398/


#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为：',file1.name)

line = file1.readline()
print("读取第一行: %s" % (line))

line = file1.readline()
print("读取第二行: %s" % (line))

line = file1.readline()
print("读取第三行: %s" % (line))

line = file1.readline(7)
print("读取的字符串: %s" % (line))


#关闭文件
file1.close()


===输出结果===
文件名为： E:/test.txt
读取第一行: 1:https://blog.csdn.net/wanbin6470398/

读取第二行: 2:https://blog.csdn.net/wanbin6470398/

读取第三行: 3:https://blog.csdn.net/wanbin6470398/

读取的字符串: 4:https

file.readlines([sizeint])

概述

readlines() 方法用于读取所有行(直到结束符 EOF)并返回列表，该列表可以由 Python 的 for… in … 结构进行处理。如果碰到结束符 EOF则返回空字符串。

如果碰到结束符 EOF 则返回空字符串。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为：',file1.name)

line = file1.readlines()
print("读取的数据: %s" % (line))

for each  in line:                 #依次读取每行
    each = each.strip()            #去掉每行头尾空白
    print("处理的数据为：%s" % each)

#关闭文件
file1.close()

===输出结果===
读取的数据: ['1:https://blog.csdn.net/wanbin6470398/\n', '2:https://blog.csdn.net/wanbin6470398/\n', '3:https://blog.csdn.net/wanbin6470398/\n', '4:https://blog.csdn.net/wanbin6470398/\n', '5:https://blog.csdn.net/wanbin6470398/\n']
处理的数据为：1:https://blog.csdn.net/wanbin6470398/
处理的数据为：2:https://blog.csdn.net/wanbin6470398/
处理的数据为：3:https://blog.csdn.net/wanbin6470398/
处理的数据为：4:https://blog.csdn.net/wanbin6470398/
处理的数据为：5:https://blog.csdn.net/wanbin6470398/

file.seek(offset[, whence])

概述

seek() 方法用于移动文件读取指针到指定位置。

参数

offset – 开始的偏移量，也就是代表需要移动偏移的字节数

whence：可选，默认值为 0。给offset参数一个定义，表示要从哪个位置开始偏移；0代表从文件开头开始算起，1代表从当前位置开始算起，2代表从文件末尾算起。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为：',file1.name)

line = file1.readline()
print("读取的数据: %s" % (line))

#重新设置文件读取指针到开头
file1.seek(0)
line = file1.readline()
print("读取的数据: %s" % (line))

#关闭文件
file1.close()

===输出结果===
文件名为： E:/test.txt
读取的数据: 1:https://blog.csdn.net/wanbin6470398/

读取的数据: 1:https://blog.csdn.net/wanbin6470398/

file.tell()

概述

tell() 方法返回文件的当前位置，即文件指针当前位置。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为：',file1.name)

line = file1.readline()
print("读取的数据: %s" % (line))

#获取当前位置
pos = file1.tell()
print("当前位置: %d" % pos)

#关闭文件
file1.close()

===输出结果===
文件名为： E:/test.txt
读取的数据: 1:https://blog.csdn.net/wanbin6470398/

当前位置: 40

file.truncate([size])

概述

truncate() 方法用于从文件的首行首字符开始截断，截断文件为 size 个字符，无 size 表示从当前位置截断；截断之后 V 后面的所有字符被删除，其中 Widnows 系统下的换行代表2个字符大小。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r+')
print('文件名为：',file1.name)

print('读取行：%s' % file1.readline())

file1.truncate()
print('读取行：%s' % file1.readlines())

#关闭文件
file1.close()

===输出结果===
文件名为： E:/test.txt
读取行：1:https://blog.csdn.net/wanbin6470398/

读取行：['2:https://blog.csdn.net/wanbin6470398/\n', '3:https://blog.csdn.net/wanbin6470398/\n', '4:https://blog.csdn.net/wanbin6470398/\n', '5:https://blog.csdn.net/wanbin6470398/']

`file.write(str)`

概述

write() 方法用于向文件中写入指定字符串。

在文件关闭前或缓冲区刷新前，字符串内容存储在缓冲区中，这时你在文件中是看不到写入的内容的。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r+',encoding='utf-8')
print('文件名为：',file1.name)

#在文件末尾写入一行
file1.seek(0,2)
file1.write('\n6:https://blog.csdn.net/wanbin6470398/')
print(file1)
#读取文件所有内容
file1.seek(0,0)
for index in range(1,7):
    line = next(file1)
    print("文件行号 %d - %s" % (index, line))

#关闭文件
file1.close()

===输出结果===
文件名为： E:/test.txt
<_io.TextIOWrapper name='E:/test.txt' mode='r+' encoding='utf-8'>
文件行号 1 - 1:https://blog.csdn.net/wanbin6470398/

文件行号 2 - 2:https://blog.csdn.net/wanbin6470398/

文件行号 3 - 3:https://blog.csdn.net/wanbin6470398/

文件行号 4 - 4:https://blog.csdn.net/wanbin6470398/

文件行号 5 - 5:https://blog.csdn.net/wanbin6470398/

文件行号 6 - 6:https://blog.csdn.net/wanbin6470398/

file.writelines(sequence)

概述

writelines() 方法用于向文件中写入一序列的字符串。

这一序列字符串可以是由迭代对象产生的，如一个字符串列表。

换行需要制定换行符 \n。
示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','w+',encoding='utf-8')
print('文件名为：',file1.name)

seq = ['csdn1\n','csdn2\n','csdn3\n']
file1.writelines(seq)

#刷新缓冲区，把数据保存到磁盘
file1.flush()

#定位到文件开头位置
file1.seek(0)
print('文件内容：%s' % file1.read())

#关闭文件
file1.close()

===输出结果===
文件名为： E:/test.txt
文件内容：csdn1
csdn2
csdn3

测试题：

0. 下边只有一种方式不能打开文件，请问是哪一种，为什么？

>>> f = open('E:/test.txt', 'w')   # A
>>> f = open('E:\test.txt', 'w')   # B
>>> f = open('E://test.txt', 'w')  # C
>>> f = open('E:\\test.txt', 'w')  # D

答：B不能打开文件。

Windows在路径名中既可以接受斜线（/）也可以接受反斜线（\），不过如果使用反斜线作为路径名的分隔符的话，要注意使用双反斜线（\\）进行转义，否则Python会将反斜线进行转义，例如（\n）看成一个换行符，（\t）看作一个制表符等。

1. 打开一个文件我们使用open()函数，通过设置文件的打开模式，决定打开的文件具有那些性质，请问默认的打开模式是什么呢？

答：open()函数默认的打开模式是'rt'，即可读、文本的模式打开。

2. 请问 >>> open('E:\\Test.bin', 'xb') 是以什么样的模式打开文件的？

答：以“可写入以及二进制模式”打开文件“E:\\Test.bin”。

这里要注意的是'x'和'w'均是以“可写入”的模式打开文件，但以'x'模式打开的时候，如果路径下已经存在相同的文件名，会抛出异常，而'w'模式的话会直接覆盖同名文件。

因此，'w'模式打开文件会比较危险，容易导致此前的内容遗失，因此使用'w'模式打开文件前先检查该文件名是否已经存在显得非常重要！下节课小甲鱼会教你如何安全的打开一个文件^_^

3. 尽管Python有所谓的“垃圾回收机制”，但对于打开了的文件，在不需要用到的时候我们仍然需要使用f.close()将文件对象“关闭”，这是为什么呢？

答：Python拥有垃圾收集机制，会在文件对象的引用计数降至零的时候自动关闭文件，所以在Python编程里，如果忘记关闭文件并不会造成内存泄漏那么危险。

但并不是说就可以不要关闭文件，如果你对文件进行了写入操作，那么你应该在完成写入之后进行关闭文件。因为Python可能会缓存你写入的数据，如果这中间断电了神马的，那些缓存的数据根本就不会写入到文件中。所以，为了安全起见，要养成使用完文件后立刻关闭的优雅习惯。

4. 如何将一个文件对象（f）中的数据存放进列表中？

答：list(f)，是不是非常的方便！

5. 如何迭代打印出文件对象（f）中的每一行数据？

答：直接使用for语句把文件对象迭代出来即可
for each_line in f:
        print(each_line)

6. 文件对象的内置方法f.read([size=-1])作用是读取文件对象内容，size参数是可选的，那如果设置了size=10，例如f.read(10)，将返回什么内容呢？

答：将返回从文件指针开始（注意这里并不是文件头哦）的连续10个字符。

7. 如何获得文件对象（f）当前文件指针的位置？

答：f.tell()会告诉你^_^

8. 还是视频中的那个演示文件（record.txt），请问为何f.seek(45, 0)不会出错，但f.seek(46)就出错了呢？

>>> f.seek(46)
46
>>> f.readline()
Traceback (most recent call last):
  File "<pyshell#18>", line 1, in <module>
    f.readline()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xe3 in position 4: illegal multibyte sequence

答：因为使用f.seek()定位的文件指针是按字节为单位进行计算的，演示文件（record.txt）是以GBK进行编码的，按照规则，一个汉字需要占用两个字节，f.seek(45)的位置位于字符“小”的开始位置，因此可以正常打印，而f.seek(46)的位置刚好位于字符“小”的中间位置，因此按照GBK编码的形式无法将其解码！

动动手答案：

0. 尝试将文件（OpenMe.mp3）打印到屏幕上（大家自己找个mp3试试就行或者我待会上传一下）

答：直接使用打开文本文件的形式打开即可，至于为什么？打开后会告诉你@_@

f = open('OpenMe.mp3')
for each_line in f:
        print(each_line, end='')
f.close()

1. 编写代码，将上一题中的文件（OpenMe.mp3）保存为新文件（OpenMe.txt）

答：

f1 = open('OpenMe.mp3')
f2 = open('OpenMe.txt', 'x')        # 使用”x”打开更安全
f2.write(f1.read())
f2.close()
f1.close()