有10亿个杂乱无章的数，怎样最快地求出其中前1000大的数 - 代码天地

有10亿个杂乱无章的数，怎样最快地求出其中前1000大的数

其他 2018-11-29 17:44:38 阅读次数: 0

1）方法1

建一个1000个数的最小堆，然后依次添加剩余元素，如果大于堆顶的数（堆中最小的），将这个数替换堆顶，并调整结构使之仍然是一个最小堆，这样，遍历完后，堆中的1000个数就是所需的最大的1000个。算法的时间复杂度为O（nlogk）=n*log1000=10n（n为10亿，k为1000）。
优化的方法：分治法。可以把所有10亿个数据分组存放，比如分别放在1000个文件中。这样处理就可以分别在每个文件的10^6个数据中找出最大的10000个数，合并到一起再找出最终的结果。
优化的方法：如果这10亿个数里面有很多重复的数，先通过Hash法，把这10亿个数字去重复，这样如果重复率很高的话，会减少很大的内存用量，从而缩小运算空间，然后通过分治法或最小堆法查找最大的1000个数。
---------------------
原文：https://blog.csdn.net/jiangyanting2011/article/details/70325215
2）方法2

借助于一个1000大小的数组，以数据流的形式读入数据，如果读入的数据少于1000，将这些数据按从小到大的顺序进行排序。然后当读入的数据多余1000的时候，与最小的数据进行比较，如果比数组中最小的数都小，则继续读入后续数据；如果比最小的数大，则去掉数组中最小的数据，并将该数据插入数组中相应的位置（相当于对数据进行一次遍历），直到所有的数据读完，最后数组中的数就是前1000大的数据。

方法2 相比方法1 时间复杂度高，方法2时间复杂度：O（n*k）

猜你喜欢

转载自www.cnblogs.com/ArleneZhangfj/p/10039736.html

有10亿个杂乱无章的数，怎样最快地求出其中前1000大的数

【面试现场】如何在10亿数中找出前1000大的数

如何在10亿数中找出前1000大的数

【自用】杂乱无章的整理。。。

杂乱无章的小笔记

杂乱无章原因简要分析

告别杂乱无章的文件柜！AI文档管理系统的7大好处

面试题：如何在10亿个随机整数中找出前1000个最大的数

杂乱无章的第三四天学习心得

一些杂乱无章的小Tips

Git笔记（杂乱无章，慎入）

玩转杂乱无章的java日志体系

关于Hadoop的杂乱无章（续更）

关于java的杂乱无章（续更）

Java杂乱无章-判断为空的编码规范

Java杂乱无章-时间工具类

杂乱无章的笔记，函数稍微详细点

算法面试：10亿个数中取TOP-1000个数

海量数找前1000大

N个数(其中数可重复)，求出其中第m大的数。

寻找TopN——在10亿数据中找到1000个最大的数

mysql杂乱无章的第一次学习和使用

div + span + 盒模式笔记 --- 杂乱无章随手而写

给刚毕业出来找工作的伙伴的一封杂乱无章的文章

加密价格更新周期：看似杂乱无章，实际内藏玄机

桌面文件整顿bat代码：一键归类桌面杂乱无章的文件

思维练习-10：计算1000以内，能被7整除的前20个数

1.在屏幕上输出以下图案。2.求出0〜999之间的所有“水仙花数”并输出。3. 求Sn=a+aa+aaa+aaaa+aaaaa的前5项之和，其中a是一个数字

【C# 练习】求出1~1000之间的所有能被7整除的数，并计算和输出每5个的和

有1千万个随机数，随机数的范围在1到1亿之间，将1到1亿之间没有在随机数中的数求出来

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)