python集合的应用小技巧 - 代码天地

python集合的应用小技巧

其他 2021-03-20 10:12:00 阅读次数: 0

假设我们有两个日志文件a.txt和b.txt，a和b中有些数据又是重复的，我们需要分析a中的内容和b中的内容然后要最终提取出来b中有的但是a中没有的，而且不能有重复的。按照传统的思路我们会写一个循环去一条一条判断然后再记录下结果，但是这样很慢，尤其是数据量很大的时候，这时候我们就可以利用python的集合来快速解决了，哪怕是几百万条记录，也可以很快搞定。

演示如下（这里a和b里有许多重复的值）
[root@localhost ~]# cat a.txt
123
123
123
456
456
789
789
[root@localhost ~]# cat b.txt
123
456
456
789
789
aaa
bbb
ccc
[root@localhost ~]# python
>>> f1 = open('a.txt')
>>> f2 = open('b.txt')

>>> f3 = open('c.txt','w')
>>> s1 = set(f1)
>>> s2 = set(f2)
>>> f3.writelines(s2 - s1)
>>> f1.close()
>>> f2.close()
>>> f3.close()

[root@localhost ~]# cat c.txt
ccc
aaa
bbb
这就得到了我们想要的结果。

猜你喜欢

转载自blog.csdn.net/weixin_42182501/article/details/89036375

python集合的应用小技巧

python列表集合中常用的小技巧

小技巧集合

C：小技巧集合

vue应用技巧集合

js应用技巧集合

python常用小技巧&深拷贝浅拷贝&集合

python学习过程中的小技巧集合

ORCAD应用小技巧

css 应用小技巧

MySQL语句小技巧集合

Jupyter Notebook 小技巧集合

[js数据技巧] js小技巧集合

Java 集合13 集合查询小技巧

钉钉小程序 H5应用开发实用工具及常用技巧集合

python使用小技巧

python小技巧

python操作小技巧

python小技巧总结

Python的生活小技巧

python 符号小技巧

Python 小技巧

python编程小技巧

实用的Python小技巧

python 输出小技巧

Python实用小技巧

python 编程小技巧

Python 实用小技巧

python必备小技巧

python常用小技巧

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)