《零基础入门学习Python》(28)--文件

前言

文件操作作为一个非常重要的学习部分,接下来我看看文件的相关操作

知识点

Python中使用open(...)这个内置函数来打开文件,并返回文件对象

open()函数参数说明:

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None) 

file: 传入文件名,如果只有文件名(不带路径),Python会在当前文件夹里去查找这个文件并打开 

mode: 文件打开模式,默认为r(读取)

文件打开模式表

打开模式 执行操作
'r' 以只读方式打开文件(默认)
'w' 以写入的方式打开文件,会覆盖已存在的文件
'x' 如果文件已经存在,使用此模式打开将引发异常
'a' 以写入模式打开,如果文件存在,则在末尾追加写入
'b' 以二进制模式打开文件
't' 以文本模式打开(默认)
'+' 可读写模式(可添加到其他模式中使用)
'U' 通用换行符支持

文件对象方法


序号    方法    说明
1    file.close()    关闭文件。关闭后文件不能再进行读写操作。
2    file.flush()    刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。
3    file.fileno()    返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。
4    file.isatty()    如果文件连接到一个终端设备返回 True,否则返回 False。
5    file.next()    返回文件下一行。
6    file.read([size])    从文件读取指定的字节数,如果未给定或为负则读取所有。
7    file.readline([size])    读取整行,包括 “\n” 字符。
8    file.readlines([sizeint])    读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。
9    file.seek(offset[, whence])    设置文件当前位置
10    file.tell()    返回文件当前位置。
11    file.truncate([size])    从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后 V 后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字符大小。
12    file.write(str)    将字符串写入文件,没有返回值。
13    file.writelines(sequence)    向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。
 

各方法详细说明

file.close()

概述:

方法用于关闭一个已打开的文件。关闭后的文件不能再进行读写操作, 否则会触发 ValueError: I/O operation on closed file.错误。 close()方法允许调用多次。

当 file 对象,被引用到操作另外一个文件时,Python 会自动关闭之前的 file 对象。 使用 close() 方法关闭文件是一个好的习惯。

示例:

#!/usr/bin/python3

#打开文件

file1 = open('E:/test1.txt','wt')
print('文件名为:',file1.name)

#关闭文件
file1.close()

====输出结果====
文件名为: E:/test1.txt

file.flush()

概述 

flush() 方法是用来刷新缓冲区的,即将缓冲区中的数据立刻写入文件,同时清空缓冲区,不需要是被动的等待输出缓冲区写入。

一般情况下,文件关闭后会自动刷新缓冲区,但有时你需要在关闭前刷新它,这时就可以使用 flush() 方法。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test1.txt','wt')
print('文件名为:',file1.name)

# 刷新缓冲区
file1.flush()

#关闭文件
file1.close()

====输出结果====
文件名为: E:/test1.txt

file.fileno()

概述 

fileno() 方法返回一个整型的文件描述符(file descriptor FD 整型),可用于底层操作系统的 I/O 操作。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test1.avi','wt')
print('文件名为:',file1.name)

fid = file1.fileno()
print('文件描述符为: ', fid)

#关闭文件
file1.close()

====输出结果====
文件名为: E:/test1.avi
文件描述符为:  3

file.isatty()

概述 

isatty() 方法检测文件是否连接到一个终端设备,如果连接到一个终端设备返回 True,否则返回 False。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test1.avi','wt')
print('文件名为:',file1.name)

ret = file1.isatty()
print('返回值: ', ret)

#关闭文件
file1.close()

====输出结果====
文件名为: E:/test1.avi
返回值:  False

file.next()

概述 

next(iterator[,default])

Python 3 中的 File 对象不支持 next() 方法。 Python 3 的内置函数 next() 通过迭代器调用 __next__()方法返回下一项。 在循环中,next()方法会在每次循环中调用,该方法返回文件的下一行,如果到达结尾(EOF),则触发StopIteration

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为:',file1.name)

for each in range(1,7):
    line = next(file1)
    print("第 %d 行 - %s" % (each, line))

#关闭文件
file1.close()

===输出结果===
Traceback (most recent call last):
  File "D:/untitled/Python_learn/File_Test.py", line 9, in <module>
    line = next(file1)
StopIteration
文件名为: E:/test.txt
第 1 行 - 这是第一行

第 2 行 - 这是第二行

第 3 行 - 这是第三行

第 4 行 - 这是第四行

第 5 行 - 这是第五行

===输出结果===
文件名为: E:/test.txt
读取的字符串: 这是第一行
这是第二
  • file.read([size])

概述 

read() 方法用于从文件读取指定的字节数,如果未给定或为负则读取所有。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为:',file1.name)

line = file1.read(10)
print("读取的字符串: %s" % (line))

#关闭文件
file1.close()
文链接!

file.readline([size])

概述 

readline() 方法用于从文件读取整行,包括 “\n” 字符。如果指定了一个非负数的参数,则返回指定大小的字节数,包括 “\n” 字符。

示例

text.txt文件内容:
1:https://blog.csdn.net/wanbin6470398/
2:https://blog.csdn.net/wanbin6470398/
3:https://blog.csdn.net/wanbin6470398/
4:https://blog.csdn.net/wanbin6470398/
5:https://blog.csdn.net/wanbin6470398/


#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为:',file1.name)

line = file1.readline()
print("读取第一行: %s" % (line))

line = file1.readline()
print("读取第二行: %s" % (line))

line = file1.readline()
print("读取第三行: %s" % (line))

line = file1.readline(7)
print("读取的字符串: %s" % (line))


#关闭文件
file1.close()


===输出结果===
文件名为: E:/test.txt
读取第一行: 1:https://blog.csdn.net/wanbin6470398/

读取第二行: 2:https://blog.csdn.net/wanbin6470398/

读取第三行: 3:https://blog.csdn.net/wanbin6470398/

读取的字符串: 4:https
  • file.readlines([sizeint])

概述 

readlines() 方法用于读取所有行(直到结束符 EOF)并返回列表,该列表可以由 Python 的 for… in … 结构进行处理。 如果碰到结束符 EOF则返回空字符串。

如果碰到结束符 EOF 则返回空字符串。

示例
 

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为:',file1.name)

line = file1.readlines()
print("读取的数据: %s" % (line))

for each  in line:                 #依次读取每行
    each = each.strip()            #去掉每行头尾空白
    print("处理的数据为:%s" % each)

#关闭文件
file1.close()

===输出结果===
读取的数据: ['1:https://blog.csdn.net/wanbin6470398/\n', '2:https://blog.csdn.net/wanbin6470398/\n', '3:https://blog.csdn.net/wanbin6470398/\n', '4:https://blog.csdn.net/wanbin6470398/\n', '5:https://blog.csdn.net/wanbin6470398/\n']
处理的数据为:1:https://blog.csdn.net/wanbin6470398/
处理的数据为:2:https://blog.csdn.net/wanbin6470398/
处理的数据为:3:https://blog.csdn.net/wanbin6470398/
处理的数据为:4:https://blog.csdn.net/wanbin6470398/
处理的数据为:5:https://blog.csdn.net/wanbin6470398/
  • file.seek(offset[, whence])

概述 

seek() 方法用于移动文件读取指针到指定位置。

参数 

offset – 开始的偏移量,也就是代表需要移动偏移的字节数

whence:可选,默认值为 0。给offset参数一个定义,表示要从哪个位置开始偏移;0代表从文件开头开始算起,1代表从当前位置开始算起,2代表从文件末尾算起。

示例
 

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为:',file1.name)

line = file1.readline()
print("读取的数据: %s" % (line))

#重新设置文件读取指针到开头
file1.seek(0)
line = file1.readline()
print("读取的数据: %s" % (line))

#关闭文件
file1.close()

===输出结果===
文件名为: E:/test.txt
读取的数据: 1:https://blog.csdn.net/wanbin6470398/

读取的数据: 1:https://blog.csdn.net/wanbin6470398/
  • file.tell()

概述 

tell() 方法返回文件的当前位置,即文件指针当前位置。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r')
print('文件名为:',file1.name)

line = file1.readline()
print("读取的数据: %s" % (line))

#获取当前位置
pos = file1.tell()
print("当前位置: %d" % pos)

#关闭文件
file1.close()

===输出结果===
文件名为: E:/test.txt
读取的数据: 1:https://blog.csdn.net/wanbin6470398/

当前位置: 40
  • file.truncate([size])

概述 

truncate() 方法用于从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后 V 后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字符大小。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r+')
print('文件名为:',file1.name)

print('读取行:%s' % file1.readline())

file1.truncate()
print('读取行:%s' % file1.readlines())

#关闭文件
file1.close()

===输出结果===
文件名为: E:/test.txt
读取行:1:https://blog.csdn.net/wanbin6470398/

读取行:['2:https://blog.csdn.net/wanbin6470398/\n', '3:https://blog.csdn.net/wanbin6470398/\n', '4:https://blog.csdn.net/wanbin6470398/\n', '5:https://blog.csdn.net/wanbin6470398/']

file.write(str)

概述 

write() 方法用于向文件中写入指定字符串。

在文件关闭前或缓冲区刷新前,字符串内容存储在缓冲区中,这时你在文件中是看不到写入的内容的。

示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','r+',encoding='utf-8')
print('文件名为:',file1.name)

#在文件末尾写入一行
file1.seek(0,2)
file1.write('\n6:https://blog.csdn.net/wanbin6470398/')
print(file1)
#读取文件所有内容
file1.seek(0,0)
for index in range(1,7):
    line = next(file1)
    print("文件行号 %d - %s" % (index, line))

#关闭文件
file1.close()

===输出结果===
文件名为: E:/test.txt
<_io.TextIOWrapper name='E:/test.txt' mode='r+' encoding='utf-8'>
文件行号 1 - 1:https://blog.csdn.net/wanbin6470398/

文件行号 2 - 2:https://blog.csdn.net/wanbin6470398/

文件行号 3 - 3:https://blog.csdn.net/wanbin6470398/

文件行号 4 - 4:https://blog.csdn.net/wanbin6470398/

文件行号 5 - 5:https://blog.csdn.net/wanbin6470398/

文件行号 6 - 6:https://blog.csdn.net/wanbin6470398/
  • file.writelines(sequence)

概述 

writelines() 方法用于向文件中写入一序列的字符串。

这一序列字符串可以是由迭代对象产生的,如一个字符串列表。

换行需要制定换行符 \n。 
示例

#!/usr/bin/python3

# 打开文件

file1 = open('E:/test.txt','w+',encoding='utf-8')
print('文件名为:',file1.name)

seq = ['csdn1\n','csdn2\n','csdn3\n']
file1.writelines(seq)

#刷新缓冲区,把数据保存到磁盘
file1.flush()

#定位到文件开头位置
file1.seek(0)
print('文件内容:%s' % file1.read())

#关闭文件
file1.close()

===输出结果===
文件名为: E:/test.txt
文件内容:csdn1
csdn2
csdn3


测试题:

0. 下边只有一种方式不能打开文件,请问是哪一种,为什么?

>>> f = open('E:/test.txt', 'w')   # A
>>> f = open('E:\test.txt', 'w')   # B
>>> f = open('E://test.txt', 'w')  # C
>>> f = open('E:\\test.txt', 'w')  # D
答:B不能打开文件。

Windows在路径名中既可以接受斜线(/)也可以接受反斜线(\),不过如果使用反斜线作为路径名的分隔符的话,要注意使用双反斜线(\\)进行转义,否则Python会将反斜线进行转义,例如(\n)看成一个换行符,(\t)看作一个制表符等。

1. 打开一个文件我们使用open()函数,通过设置文件的打开模式,决定打开的文件具有那些性质,请问默认的打开模式是什么呢?

答:open()函数默认的打开模式是'rt',即可读、文本的模式打开。

2. 请问 >>> open('E:\\Test.bin', 'xb') 是以什么样的模式打开文件的?

答:以“可写入以及二进制模式”打开文件“E:\\Test.bin”。

这里要注意的是'x'和'w'均是以“可写入”的模式打开文件,但以'x'模式打开的时候,如果路径下已经存在相同的文件名,会抛出异常,而'w'模式的话会直接覆盖同名文件。

因此,'w'模式打开文件会比较危险,容易导致此前的内容遗失,因此使用'w'模式打开文件前先检查该文件名是否已经存在显得非常重要!下节课小甲鱼会教你如何安全的打开一个文件^_^

3. 尽管Python有所谓的“垃圾回收机制”,但对于打开了的文件,在不需要用到的时候我们仍然需要使用f.close()将文件对象“关闭”,这是为什么呢?

答:Python拥有垃圾收集机制,会在文件对象的引用计数降至零的时候自动关闭文件,所以在Python编程里,如果忘记关闭文件并不会造成内存泄漏那么危险。

但并不是说就可以不要关闭文件,如果你对文件进行了写入操作,那么你应该在完成写入之后进行关闭文件。因为Python可能会缓存你写入的数据,如果这中间断电了神马的,那些缓存的数据根本就不会写入到文件中。所以,为了安全起见,要养成使用完文件后立刻关闭的优雅习惯。

4. 如何将一个文件对象(f)中的数据存放进列表中?

答:list(f),是不是非常的方便!

5. 如何迭代打印出文件对象(f)中的每一行数据?

答:直接使用for语句把文件对象迭代出来即可
for each_line in f:
        print(each_line)

6. 文件对象的内置方法f.read([size=-1])作用是读取文件对象内容,size参数是可选的,那如果设置了size=10,例如f.read(10),将返回什么内容呢?

答:将返回从文件指针开始(注意这里并不是文件头哦)的连续10个字符。

7. 如何获得文件对象(f)当前文件指针的位置?

答:f.tell()会告诉你^_^

8. 还是视频中的那个演示文件(record.txt),请问为何f.seek(45, 0)不会出错,但f.seek(46)就出错了呢?

>>> f.seek(46)
46
>>> f.readline()
Traceback (most recent call last):
  File "<pyshell#18>", line 1, in <module>
    f.readline()
UnicodeDecodeError: 'gbk' codec can't decode byte 0xe3 in position 4: illegal multibyte sequence
答:因为使用f.seek()定位的文件指针是按字节为单位进行计算的,演示文件(record.txt)是以GBK进行编码的,按照规则,一个汉字需要占用两个字节,f.seek(45)的位置位于字符“小”的开始位置,因此可以正常打印,而f.seek(46)的位置刚好位于字符“小”的中间位置,因此按照GBK编码的形式无法将其解码!

动动手答案:

0. 尝试将文件(OpenMe.mp3)打印到屏幕上(大家自己找个mp3试试就行或者我待会上传一下)

答:直接使用打开文本文件的形式打开即可,至于为什么?打开后会告诉你@_@

f = open('OpenMe.mp3')
for each_line in f:
        print(each_line, end='')
f.close()

1. 编写代码,将上一题中的文件(OpenMe.mp3)保存为新文件(OpenMe.txt)

答:

f1 = open('OpenMe.mp3')
f2 = open('OpenMe.txt', 'x')        # 使用”x”打开更安全
f2.write(f1.read())
f2.close()
f1.close()

猜你喜欢

转载自blog.csdn.net/qq_38721302/article/details/83216060
今日推荐