Python数据处理工具—去除TXT文件里面相同的数据

数据库 2023-09-03 08:40:04 阅读次数: 0

前言

本次分享的是一个对TXT数据进行处理的一个小工具，功能如题，是把TXT里面相同的数据给清洗掉是剩下唯一的一个。

一、数据

随便在文件里面写了一点数据，可以看到里面有很多重复的数据，那么里面重复的就是我们要进行清理的。

二、代码

1.实现代码

代码如下：

# 去除txt里面相同的数据
f_read = open(r'./需清理的TXT.txt', 'r', encoding='utf-8')  # 将需要去除重复值的txt文本输入
f_write = open(r'./需清理的TXT1.txt', 'w',encoding='utf-8')  # 去除重复值之后，生成新的txt文本 --“去除重复值后的文本.txt”,如果写入到原txt会把之前的数据覆盖
data = set()  # 创建一个存放数据的集合
for a in [a.strip('\n') for a in list(f_read)]:  # 把读取进来的数据变成列表，再逐个循环读取列表里面的数据（去除开头和结尾的换行）
    if a not in data:  # 判断循环的数据在不在集合里，不在就添加进集合
        data.add(a)
        f_write.write(a + '\n')
f_read.close()
f_write.close()
print('完成')

2.结果

可以看到相比于上面的数据，都保留下了唯一的数据，多余的数据都被清理掉了

总结

整体代码实现还是比较简单的，用到的都是Python自带的一些方法。整体逻辑是读取文件→判断是否在集合里，不在就添加进集合→写入一个新的TXT文件。TXT用的是覆盖写入，会把之前写入的东西覆盖，所以只会保留最后一次集合的结果。

猜你喜欢

转载自blog.csdn.net/weixin_54243306/article/details/129044856

Python数据处理工具—去除TXT文件里面相同的数据

Python数据处理工具——切分TXT文件数据，保存到Excel

Python数据处理工具----pandas

Python数据处理工具——去除Excel文本中多余的空行，并且写入到原来的位置

Python数据处理工具使用方法整理

python量化投资：数据处理工具

python .txt文件读取及数据处理总结

python 数据处理对txt文件进行数据处理

sqlite数据处理工具

hadoop大数据处理工具

awk 数据处理工具

awk数据处理工具

大数据处理工具

经典的数据处理工具—awk

常用数据处理工具

考勤数据处理工具

awk: 好用的数据处理工具

matlab 对txt文件数据处理

linux之找出两个文件里面相同的数据

CDA数据分析【数据处理工具SPSS】

大数据开发利器——高效数据处理工具

python数据处理工具包——pandas简介（如何构建数据结构篇）

吴裕雄数据挖掘与分析案例实战（4）——python数据处理工具：Pandas

python数据处理工具 -- pandas（序列与数据框的构造）

数据处理 | 对于txt文件的操作（python脚本文件）

又一超好用的 Python 数据处理工具 Mito 前来报到

Storm :twitter的实时数据处理工具

大数据处理工具优劣分析

开源大数据处理工具汇总（二）

sed管道命令及数据处理工具awk命令

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)