12、文件处理 b模式

一、t模式与b模式的区别

1.1、控制文件读写内容的模式

1.1.1、t 模式

  (1)读写都是以字符串(unicode)为单位

  (2)读写只能针对文本

  (3)必须指定字符编码,即必须指定encoding参数

1.1.2、b 参数

  (1)读写都是以二进制(bytes)为单位

  (2)可以针对任意类型文件

  (3)一定不能指定字符编码,即不能指定encoding参数

  (4)需要手动编码解码

扫描二维码关注公众号,回复: 9874721 查看本文章

1.1.3、总结

  (1)在纯文本文件操作时,使用t模式可以帮我们省去编码和解码的过程,b模式则需要手动去编码和解码,所以此时t模式更加的方便。

  (2)针对非文本文件(图片,视频等)时,只能使用b模式进行操作,

1.2、 b 模式下对文件一次性的读写

1.2.1、读取文件  rb

with open(r'd.txt',mode='rb') as f:
    res=f.read() # utf-8的二进制
    print(res,type(res))     #  读出二进制代码
    print(res.decode('utf-8'))     #  读出文件内容

1.2.2、 写入文件 wb

with open(r'f.txt',mode='wb') as f:
    f.write('你好hello'.encode('utf-8'))  #必须加入encode
    f.write('哈哈哈'.encode('gbk'))    #读取时只能以gbk模式或者utf-8读写

1.2.3、文件拷贝工具  rb+wb

src_file=input('源文件路径>>: ').strip()
dst_file=input('源文件路径>>: ').strip()
with open(r'{}'.format(src_file),mode='rb') as f1,\
    open(r'{}'.format(dst_file),mode='wb') as f2:
    res=f1.read()     # 存在内存占用过大的可能
    f2.write(res)

    for line in f1:      #优化的方法
        f2.write(line)

1.3、循环读取文件,分次读写

1.3.1、以字节为单位,自己控制每次自己读取数据的数据量

with open(r'test.jpg',mode='rb') as f:
    while True:
        res=f.read(1024) # 1024
        if len(res) == 0:
            break
        print(len(res))

1.3.2、以每行为单位进行读写,但是也有可能出现一次性单行读出数据量过大

1.3.2.1、w模式下for循环读文件

with open(r'g.txt',mode='rt',encoding='utf-8') as f:
    for line in f:
        print(len(line),line)

1.3.2.2、b模式下for循环读文件

with open(r'g.txt',mode='rb') as f:
    for line in f:
        print(line)#文件内容均为字母或数字,否则需要加encode

1.3.2.3、b模式下for循环读图片

with open(r'test.jpg',mode='rb') as f:
    for line in f:
        print(line) #此内容为数字和字母形式,没有加encode

二、文件操作的其他方法

2.1、读相关操作

2.1.1、w模式下while循环读文件,readline(一次只能读一行)

with open(r'g.txt',mode='rt',encoding='utf-8') as f:
    res1=f.readline()
    res2=f.readline()
    print(res2)
#使用while循环读取
    while True:
        line=f.readline()
        if len(line) == 0:
            break
        print(line)

2.1.2、b模式下,一次性多行读写。存为列表形式。readlines

with open(r'g.txt',mode='rt',encoding='utf-8') as f:
    res=f.readlines()
    print(res)

2.1.3、read和readlines的区别

  read是按照文件内容直接读出,readlines是将文件内容以列表的形式读出

  注:read和readlines都是将文件内容一次性读入内存,如果内容过大,有可能会将内存溢出,可以使用for循环单行读入,或者read(n)限制一次性读写字节数。

2.2、写相关操作

2.2.1、一次性多行写入 writelines

f.writelines():
with open('h.txt',mode='wt',encoding='utf-8') as f:
#使用write写入    
     f.write('1111\n222\n3333\n')
#使用for循环+write写入
    # l=['11111\n','2222','3333',4444]
    l=['11111\n','2222','3333']
     for line in l:
         f.write(line)
#使用writelines写入
    f.writelines(l)

2.2.2、b模式下文件的写入

with open('h.txt', mode='wb') as f:
    l = [
        '1111aaa1\n'.encode('utf-8'),
        '222bb2'.encode('utf-8'),
        '33eee33'.encode('utf-8')
    ]

    # 补充1:如果是纯英文字符,可以直接加前缀b得到bytes类型
    l = [
        b'1111aaa1\n',
        b'222bb2',
        b'33eee33'
    ]

    # 补充2:'上'.encode('utf-8') 等同于bytes('上',encoding='utf-8')
    l = [
        bytes('上啊',encoding='utf-8'),
        bytes('冲呀',encoding='utf-8'),
        bytes('小垃圾们',encoding='utf-8'),
    ]
    f.writelines(l)

2.3、立即写入硬盘    flush

with open('h.txt', mode='wt',encoding='utf-8') as f:
    f.write('')
    # f.flush()

2.4、了解

with open('../../../../Desktop/Python课堂笔记/day12笔记/h.txt', mode='wt', encoding='utf-8') as f:
    print(f.readable())      判断文件是否可读
    print(f.writable())    判断文件是否可写
    print(f.encoding)     格式,如‘utf-8,’如果文件打开属性为b,则没有该属性
    print(f.name)         输出绝对路径

print(f.closed)      判断文件是否关闭

三、控制文件的指针移动

3.1、指针移动的单位都是以bytes/字节为单位的,但t模式下的read(n),n代表的是字符个数。

with open('aaa.txt',mode='rt',encoding='utf-8') as f:
    res=f.read(4)
    print(res)    #输出前四个字节

3.2、指针的移动  f.seek(a,b)

3.2.1、模式0,即b=0,参照物是文件开头位置

f.seek(9,0)
f.seek(3,0) # 3

with open('aaa.txt',mode='rb') as f:
f.seek(9,0)
f.seek(3,0) # 3
# print(f.tell())
f.seek(4,0)
res=f.read()
print(res.decode('utf-8'))

3.2.2、模式1,即b=1,参照物是当前指针位置

f.seek(9,1)
f.seek(3,1) # 12

with open('aaa.txt',mode='rb') as f:
f.seek(9,1)
f.seek(3,1) # 12
print(f.tell())

3.2.3、模式2,即b=2,参照物是文件结尾

f.seek(-9,2) # 3
f.seek(-3,2) # 9

with open('aaa.txt',mode='rb') as f:
f.seek(-9,2)
# print(f.tell())
f.seek(-3,2)
# print(f.tell())
print(f.read().decode('utf-8'))

注意:0模式可以在t模式下使用,0和1以及2可以在b模式下使用

3.2.4、当前指针位置 f.tell()

f.tell() # 获取文件指针当前位置

猜你喜欢

转载自www.cnblogs.com/jingpeng/p/12507120.html