代码图片
txt 文件
emailaddress.txt
姓名 邮箱
张三 18556948743@qq.com
王五 16541321@qq.com
李七 1264513148@qq.com
teleaddress.txt
姓名 电话号码
张三 18556948743
王五 16541321
李四 1264513148
合并后的文件
finish_file.txt
姓名 电话 邮箱
张三 18556948743@qq.com 18556948743
王五 16541321@qq.com 16541321
李七 1264513148@qq.com -----
李四 ----- 1264513148
问题
一开始合并两个文件出现乱码
由于 JetBrains PyCharm Community Edition 2018.1.3 x64 中默认编码设置为 utf-8 导致编码出现错误。
将 teleaddress.txt 和 emailaddress.txt修改为 gbk编码,同时生成的finish_file.txt也使用gbk编码可以解决乱码问题。
代码
# 利用字符串和列表将两个通讯录文本合并为一个文本
def main():
ftele1 = open('emailaddress.txt', 'rb')
ftele2 = open('teleaddress.txt', 'rb')
ftele1.readline() # 跳过第一行
ftele2.readline()
lines1 = ftele1.readlines()
lines2 = ftele2.readlines()
list1_name = []
list1_tele = []
list2_name = []
list2_email = []
for line in lines1: # 获取第一个文本中的姓名和电话信息
elements = line.split()
list1_name.append(str(elements[0].decode('gbk')))
list1_tele.append(str(elements[1].decode('gbk'))) # 将文本读出来的bytes转换为str类型
for line in lines2: # 获取第二个文本中的姓名和邮件信息
elements = line.split()
list2_name.append(str(elements[0].decode('gbk')))
list2_email.append(str(elements[1].decode('gbk')))
###开始处理###
lines = []
lines.append('姓名\t电话\t\t邮箱\n')
# 按索引方式遍历姓名列表1
for i in range(len(list1_name)):
s = ''
if list1_name[i] in list2_name:
j = list2_name.index(list1_name[i]) # 找到姓名列表1对应列表2中的姓名索引位置
s = '\t'.join([list1_name[i], list1_tele[i], list2_email[j]])
s += '\n'
else:
s = '\t'.join([list1_name[i], list1_tele[i], str(' ----- ')])
s += '\n'
lines.append(s)
# 处理姓名列表2中剩余的姓名
for i in range(len(list2_name)):
s = ''
if list2_name[i] not in list1_name:
s = '\t'.join([list2_name[i], str(' ----- '), list2_email[i]])
s += '\n'
lines.append(s)
ftele3 = open('finish_file.txt', 'w')
ftele3.writelines(lines)
ftele3.close()
ftele1.close()
ftele2.close()
if __name__ == "__main__":
main()