python基础学习-文件操作(打开文件,切分后保存为新文件)

这是小甲鱼视频中的一个练习题,大概要求是

题目

#任务:将文件(talk.txt)中的数据进行分割并按照以下规律保存起来:

#–A作者的对话单独保存为A_*.txt的文件(去掉“A作者:”)

#–B作者的对话单独保存为B_*.txt的文件(去掉“B作者:”)

#–文件中总共有三段对话,分别保存为A_1.txt, B_1.txt,A_2.txt, B_2.txt, A_3.txt, B_3.txt共6个文件(提示:文件中不同的对话间已经使用“==========”分割

可以看到我自己创建的talk.txt内容如下
在这里插入图片描述

效果

先看一下完成后的效果
在这里插入图片描述
把原有的txt切分成了6个文件,每个文件单独保存对应的话语
在这里插入图片描述

未优化的代码

大部分的注意事项与说明我都写在了注释当中

#任务:将文件(talk.txt)中的数据进行分割并按照以下规律保存起来:

#–A作者的对话单独保存为A_*.txt的文件(去掉“A作者:”)

#–B作者的对话单独保存为B_*.txt的文件(去掉“B作者:”)

#–文件中总共有三段对话,分别保存为A_1.txt, B_1.txt,A_2.txt, B_2.txt, A_3.txt, B_3.txt共6个文件(提示:文件中不同的对话间已经使用“==========”分割)

f = open('talk.txt','r', encoding='UTF-8')

listA = []
listB = []
count = 1

for each_line in f:
  if each_line[:6] != '======': # 切割前几个等号即可
     (role,line_spoken) = each_line.split(':',1) # split以:进行字符切割,切割一次,这里注意txt中的符号是中文符号还是英文符号
     # 将切得到的两部分内容依次存放在role与line_spoken中
     if role == 'A作者':
       listA.append(line_spoken) # A作者的内容添加到列表A中
     if role == 'B作者':
       listB.append(line_spoken) # B作者的内容添加到列表B中
  else:
    # 遇到等号,进行文件保存操作
    file_name_A = 'A_' + str(count) + '.txt'
    file_name_B = 'B_' + str(count) + '.txt'
    
    A_file = open(file_name_A,'w') # 以w模式新建一个以file_name_A命名的txt文件
    B_file = open(file_name_B,'w') # 并贴上B_file的标签

    A_file.writelines(listA) # 将列表A中的内容写入到A_file文件中
    B_file.writelines(listB)

    A_file.close() # 关闭A_file文件
    B_file.close()

    listA = [] # 清空列表
    listB = []
    count += 1

  # 循环是以等号为判断条件,这样的话,最后一段文字结束没有等号的话,需要单独对最后一段文字进行处理(处理方法直接重复调用上述else部分)
  file_name_A = 'A_' + str(count) + '.txt'
  file_name_B = 'B_' + str(count) + '.txt'
  
  A_file = open(file_name_A,'w') # 以w模式新建一个以file_name_boy命名的txt文件
  B_file = open(file_name_B,'w') # 并贴上B_file的标签

  A_file.writelines(listA) # 将列表A中的内容写入到A_file文件中
  B_file.writelines(listB)

  A_file.close() # 关闭A_file文件
  B_file.close()

f.close()

这里的主要思想是
1、打开我们建立好的txt文件,分别以listA、listB保存A作者、B作者的说话内容,count用以计数。
2、遍历文件中的每一行,在没有遇到段落分割符号’====='时,将每一行以冒号进行分割,分割成作者名称与说话内容两部分,说话内容部分推进list当中
3、遇到段落分隔符等号部分时,创建新的txt文件,以count计数命名
4、用writelines() 方法向文件中写入一序列的字符串(之前保存的listA、listB)。
5、关闭文件。
6、循环是以等号为判断条件,这样的话,最后一段文字结束没有等号的话,需要单独对最后一段文字进行处理(处理方法直接重复调用上述else部分)
7、关闭文件

ps

这里记录一下遇到的小问题
1、python读取文件时提示
在这里插入图片描述

解决方法:

f = open('talk.txt','r', encoding='UTF-8')

后来查询到还有一种解决方法

f = open('talk.txt','rb')

2、split分割时的符号问题
在这里插入图片描述
这里是因为我txt中采用的中文符号,而程序里用的英文符号进行分割,导致出错

优化的代码

这里的优化其实只是把创建新文件,写入对话内容,关闭文件这部分内容封装到一个具体的函数中,然后进行重复调用,总体思想和上述内容一模一样,分割文件的方法也放在一个具体的函数中,然后进行调用。

# 简化版本,将命名与说话内容写入文件单独写进一个方法进行重复调用

#任务:将文件(talk.txt)中的数据进行分割并按照以下规律保存起来:

#–A作者的对话单独保存为A_*.txt的文件(去掉“A作者:”)

#–B作者的对话单独保存为B_*.txt的文件(去掉“B作者:”)

#–文件中总共有三段对话,分别保存为A_1.txt, B_1.txt,A_2.txt, B_2.txt, A_3.txt, B_3.txt共6个文件(提示:文件中不同的对话间已经使用“==========”分割)

# 创建新文件,写入对话内容,关闭文件
def save_file(listA, listB, count): 
  file_name_A = 'A_' + str(count) + '.txt'
  file_name_B = 'B_' + str(count) + '.txt'
  
  A_file = open(file_name_A,'w') # 以w模式新建一个以file_name_A命名的txt文件
  B_file = open(file_name_B,'w') # 并贴上B_file的标签

  A_file.writelines(listA) # 将列表A中的内容写入到A_file文件中
  B_file.writelines(listB)

  A_file.close() # 关闭A_file文件
  B_file.close()

# 分割文件
def spilt_file(file_name):
  f = open(file_name,'r', encoding='UTF-8')

  listA = []
  listB = []
  count = 1

  for each_line in f:
    if each_line[:6] != '======': # 切割前几个等号即可
      (role,line_spoken) = each_line.split(':',1) # split以:进行字符切割,切割一次,这里注意txt中的符号是中文符号还是英文符号
      # 将切得到的两部分内容依次存放在role与line_spoken中
      if role == 'A作者':
        listA.append(line_spoken) # A作者的内容添加到列表A中
      if role == 'B作者':
        listB.append(line_spoken) # B作者的内容添加到列表B中
    else:
      # 遇到等号,进行文件写入、保存操作
      save_file(listA, listB, count)

      listA = [] # 清空列表
      listB = []
      count += 1

    # 循环是以等号为判断条件,这样的话,最后一段文字结束没有等号的话,需要单独对最后一段文字进行处理(处理方法直接重复调用上述else部分)
    save_file(listA, listB, count)

  f.close()

spilt_file('talk.txt')

Guess you like

Origin blog.csdn.net/m0_47146037/article/details/120563198