java 大数据比较两个list集合的差值 - 代码天地

java 大数据比较两个list集合的差值

其他 2019-01-02 09:21:12 阅读次数: 0

版权声明：本文为博主原创文章，转载请标明出处。 https://blog.csdn.net/dulinanaaa/article/details/85234279

有这么个场景，每天需要定时任务插入增量数据。如果通过接口获取的直接根据时间过滤，那么就能直接就可以插入库中。但有时获取到的并不是增量数据，比如微信公众号获取关注者列表时，获取到的是全量数据，这样每天就得将全量数据与库中进行比较，只有库中不存在数据才进行插入。这就有了两个list比较差值的问题。

以前在处理该问题时，会遍历全量中的list，然后判断每个对象是否已在数中存在，如果不存在就放到一个临时List中，最后返回的临时List就是增量数据了，代码如下：

private List<String> getNeedAddOpenidList(List<String> allOpenidList, List<String> dbOpenidList) {
	    if (dbOpenidList != null && !dbOpenidList.isEmpty()) {
	    	List<String> resultList = new ArrayList<String>();
	    	
	    	if (allOpenidList != null && !allOpenidList.isEmpty()) {
	    		for (String openid : allOpenidList) {
		    		if (!dbOpenidList.contains(openid)) {
		    			resultList.add(openid);
		    		}
		    	}
	    	}
	    	return resultList;
	    } else {
	    	return allOpenidList;
	    }
    }

但这种在处理几千条数据还好，等上万、或上十万时，执行效率就会很低。即便我后来用list1.removeAll(list2)时，在处理40万条数据时，10分钟根本处理不完。

后来用如下方法，瞬间完成：

private List<String> getNeedAddOpenidList(List<String> allOpenidList, List<String> dbOpenidList) {
	    if (dbOpenidList != null && !dbOpenidList.isEmpty()) {
	    	Map<String, String> dataMap = new HashMap<String, String>();
			for (String id : dbOpenidList) {
				dataMap.put(id, id);
			}
			
			List<String> newList = new ArrayList<String>();
			for (String id : allOpenidList) {
				if (!dataMap.containsKey(id)) {
					newList.add(id);
				}
			}
			return newList;
	    } else {
	    	return allOpenidList;
	    }
    }

1.将数据库中的list转成一个map集合

2.遍历获取到的全量数据，通过主键或唯一索引之类的字段进行比较

3.如果map.get(key)不存在，放到一个临时List中

4.最后将临时List返回

如果以后有更高效率的方法，还会进行更新

猜你喜欢

转载自blog.csdn.net/dulinanaaa/article/details/85234279

java 大数据比较两个list集合的差值

Java实现比较两个List集合是否相等

java比较两个List中的不同元素查找两个集合中的不同元素

java比较两个List集合是否相同不校验元素顺序

求java两个日期的差值

java中两个list互相比较

java比较两个集合是否相等

java 获取两个List集合的交集

【Java-List】Java两个List集合取交集、并集、差集

Java判断两个时间差值

java计算两个时间的差值（包括凌晨时间）

java基础之，计算两个时间的差值

java计算两个时间差值

Java计算两个时间的月份差值

java中list排序和两个string的大小比较

Java Stream比较两个List的差异，并取出不同的对象

Java 基础学习总结（206）—— 比较两个 List 的差异

比较两个list 集合中的数据写法

java比较两个日期大小

java比较两个时间

Java两个对象属性比较

java中两个map比较

Java 比较两个日期的先后

Java比较两个时间的前后

java 比较两个时间大小

java的两个比较器

Java两个比较器

java 获取两个list集合里面中不相同的元素

Java之两个Set/List集合求并、交、差

【精】【Java8】===两个List集合取交集、并集、差集

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)