python爬虫学习(六)

Python文件读写

open函数

如果你想用python读取文件(如txt、csv等),第一步要用open函数打开文件。open()是python的内置函数,它会返回一个文件对象,这个文件对象拥有read、readline、write、close等方法。

open函数有两个参数:

open('file','mode')

参数解释

  • file:需要打开的文件路径
  • mode(可选):打开文件的模式,如只读、追加、写入等

mode常用的模式:

r:表示文件只能读取
w:表示文件只能写入
a:表示打开文件,在原有内容的基础上追加内容,在末尾写入
w+:表示可以对文件进行读写双重操作
mode参数可以省略不填,默认为r模式mode参数还可以指定以什么样的编码方式读写文本,默认情况下open是以文本形式打开文件的,比如上面的四种mode模式。

当你需要以字节(二进制)形式读写文件时,只需要在mode参数中追加’b’即可:

  • rb:以二进制格式打开一个文件,用于只读
  • wb:以二进制格式打开一个文件,用于只写
  • ab:以二进制格式打开一个文件,用于追加
  • wb+:以二进制格式打开一个文件,用于读写

当你在默认模式下读取文本文件时(二进制文件不可以),文件中的换行符会转换为’\n’形式。
默认模式下写入文件时,文本中的’\n’会转换为换行符。
在这里插入图片描述
也就是说,你读取的txt文本,其中换行符会以’\n’形式出现,写入txt文本时,文本中的’\n’会变成换行指令。

with 关键字

在打开文件时,很多人通常直接用open('file'),这样并不酷。最好使用 with 关键字。优点是当子句体结束后文件会正确关闭,即使在某个时刻引发了异常。

with open('workfile') as f:
.    read_data = f.read()

close()方法
打开文件并处理完毕后,需要关闭文件,这里用到close方法。

f.close() 用来关闭文件并立即释放它使用的所有系统资源。如果你没有显式地关闭文件,Python的垃圾回收器最终将销毁该对象并为你关闭打开的文件,但这个文件可能会保持打开状态一段时间。

应该要养成使用close()的习惯。

扫描二维码关注公众号,回复: 13771413 查看本文章

使用方法很简单:

f = open(file) # 打开文件
f.close() # 关闭文件

read()方法

当使用open函数打开文件后,就可以使用该文件对象的各种方法了,read就是其中一种。

read()会读取一些数据并将其作为字符串(在文本模式下)或字节对象(在二进制模式下)返回。

read方法有一个参数:

f.read(size) # f为文件对象
参数size(可选)为数字,表示从已打开文件中读取的字节计数,默认情况下为读取全部。

假设有一个文件sample1.txt,内容如下:

This is python big data analysis!

现在读取该文件:

with  open('sample1.txt') as f:
content = f.read()
    print(content)
    f.close()

输出:在这里插入图片描述

readline()方法

readline方法从文件中读取整行,包括换行符’\n’。

换行符(\n)留在字符串的末尾,如果文件不以换行符结尾,则在文件的最后一行省略,这使得返回值明确无误。

如果 f.readline() 返回一个空的字符串,则表示已经到达了文件末尾,而空行使用 ‘\n’ 表示,该字符串只包含一个换行符。

f.readline()有一个参数:

f.readline(size)

参数size表示从文件读取的字节数。

假设有一个文件sample2.txt,共三行,内容如下:

hello,my friends!
This is python big data analysis,
let's study.

我要用readline函数读取该文件

with  open('a.txt') as f:
    print(f.readline())
    print(f.readline(5))
    f.close()

输出:
在这里插入图片描述
readline方法会记住上一个readline函数读取的位置,接着读取下一行。

所以当你需要遍历文件每一行的时候,不妨使用readline方法吧!

readlines方法

readlines方法和readline方法长得像,但功能不一样,前面说过readline方法只读取一行,readlines方法则是读取所有行,返回的是所有行组成的列表。

readlines方法没有参数,使用更加简单。依旧以sample2.txt为例:

with  open('a.txt') as f:
    print(f.readlines())
    f.close()

输出:
在这里插入图片描述

write方法

write方法顾名思义,就是将字符串写入到文件里。

它只有一个参数:

f.write([str]) # f为文件对象

参数[str]代表要写入的字符串

使用起来也很简单,比如将下面字符串(注意里面的转行符’\n’)

'hello,my friends!\nthis is python big data analysis'

写入到文件sample3.txt里。

with  open('sample3.txt','w') as f:
    f.write('hello,my friends!\nthis is python big data analysis')
    f.close()

输出:
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/pggril/article/details/123956162
今日推荐