python 入门day09

一、字符编码补充

unicode的二进制------编码encode------->gbk格式的二进制

res=x.encode('gbk')
print(res,type(res))

unicode的二进制<------解码decode-------gbk格式的二进制

m=res.decode('gbk')
print(m)

二、文件处理

1.什么是文件

​ 文件是操作系统为应用程序或者用户提供一种操作硬盘的虚拟单位

​ 强调:
​ 文件是操作系统提供的虚拟单位
​ 应用程序或者用户对文件的读写操作其实都是向操作系统发送指令

2.为何要用文件

​ 文件对应的硬盘空间,如果需要考虑永久保存数据那必须使用文件

3.如何用文件

​ 路径问题
绝对路径
​ win: C:\a\b\c\d.txt
linux: /a/b/c/d.txt
相对路径: 相对于当前执行文件所在文件夹
a/b/c/d.txt

​ 1 打开文件

f=open(r'D:\day09\a.txt',mode='rt',encoding='utf-8')
print(f)

​ 2 读/写文件

data=f.read()
print(data)

​ 3 关闭文件

f.close() # 向操作系统发送指令,让操作系统关闭打开的文件,回收操作系统资源
print(f)
f.read()

​ 上下文管理

with open('a.txt',mode='rt',encoding='utf-8') as f:
    data=f.read()
    print(data)

三、文件的打开模式

1.基本介绍

控制文件读写操作的模式
r(默认)
w
a

控制文件读写内容的模式(不能单独使用,必须与r、w、a连用)
t(默认)
b

2.详细介绍

控制文件读写操作的模式
r(默认):只读模式,以该模式打开文件,当文件不存在时则报错,当文件存在时文件指针在文件开头

with open('a.txt',mode='rt',encoding='utf-8') as f:
    data=f.read()
    print(f.readable())     #True
    print(f.writable())     #False
    
    line=f.readline()
    print(line,end='')

    line = f.readline()
    print(line,end='')

    print('第三次读')
    line = f.readline()
    print(line, end='')
    print(data,type(data))

    for line in f:
        print(line)

    print(f.readlines())
    pass

w: 只写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时清空文件内容,文件指针在文件开头

with open('a.txt',mode='wt',encoding='utf-8') as f:
    print(f.readable())
    print(f.writable())

​ 在打开了文件不关闭的情况下,连续的写入,新写的内容总是跟在老内容之后

扫描二维码关注公众号,回复: 4243880 查看本文章
f.write('你瞅啥\n')
f.write('瞅你那熊样\n')
f.write('巴拉巴拉。。。\n')

lines=['1111\n','2222\n','3333\n']
for line in lines:
    f.write(line)
f.writelines(lines)         #可以把内容变成列表格式

f.write('aaaa\nbbb\ncccc\n')

a: 只追加写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时不清空文件内容,文件指针跳到文件末尾

with open('c.txt',mode='at',encoding='utf-8') as f:
    f.write('你好阿斯蒂芬\n')
    f.write('adfasdf\n')

    f.writelines([1,2,3])

控制文件读写内容的模式(不能单独使用,必须与r、w、a连用)
t(默认):无论读写都是以字符为单位的,只能操作文本文件,必须指定encoding参数
b:无论读写都是以bytes为单位的,可以操作所有文件,一定不能指定encoding参数

with open('a.txt',mode='rb') as f:
    data=f.read()
    print(data,type(data))
    print(data.decode('utf-8'))

with open('01.mp4',mode='rb') as f:
    data=f.read()
    print(data,type(data))



with open('a.txt',mode='wb') as f:
    f.write('字符行啊士大夫阿斯蒂芬撒旦发'.encode('utf-8'))

练习:拷贝文件小程序

with open('01.mp4',mode='rb',) as read_f,\
        open(r'D:\1111.mp4',mode='wb') as write_f:
    data=read_f.read()
    write_f.write(data)

了解:
+:不能单独使用,必须与rwa连用,r+ w+ a+

with open('a.txt','r+t',encoding='utf-8') as f:
    # print(f.readable())
    # print(f.writable())

    data=f.readline()
    print(data)
    f.write('刘清蒸')


with open('a.txt','r+t',encoding='utf-8') as f:
    # print(f.readable())
    # print(f.writable())

    f.seek(10)        #文件的指针指向第10个字节
    # print(f.tell())
    f.write('你好啊')

四、文件修改的两种方式

方式一:

  1. 以读的方式打开源文件
  2. 将文件内容一次性全读入内存,在内存完成修改
  3. 以写的方式打开源文件,然后将修改后的结果一次性写入源文件
    总结:
    优点:在文件修改过程中硬盘只存在一份数据
    缺点:浪费内存
with open('b.txt',mode='rt',encoding='utf-8') as f1:
    msg=f1.read()
    new_msg=msg.replace('alex','大SB')


with open('b.txt',mode='wt',encoding='utf-8') as f2:
    f2.write(new_msg)

方式二

  1. 以读的方式打开源文件,以写的方式打开一个临时文件
  2. 读取源文件的一行内容到内存中,将修改的结果写入临时文件,循环往复直到改
  3. 删除源文件,将临时文件重命名为源文件名
    优点:同一时间在内存中只有文件的一行内容,更节省内容
    缺点:在文件修改过程中硬盘只存在两份数据
import os

with open('b.txt',mode='rt',encoding='utf-8') as read_f,\
    open('.b.txt.swap',mode='wt',encoding='utf-8') as write_f:
    for line in read_f:
        write_f.write(line.replace('大SB','alex'))


os.remove('b.txt')
os.rename('.b.txt.swap','b.txt')

猜你喜欢

转载自www.cnblogs.com/wujinsheng/p/10021492.html