【转】5亿个数找中位数 - 代码天地

【转】5亿个数找中位数

其他 2019-12-07 21:50:52 阅读次数: 0

原文链接： http://www.cnblogs.com/qianye/archive/2012/11/29/2794533.html

找中位数最容易想到的方法就是，先对序列进行排序，取中位数，然而5亿个数要想全部读入内存需要将近2GB空间。

一种想法是采用外部排序的方法，在排序的过程中记录数据个数，找到中位数。首先采用hash() % 100,把数据分到100个文件中，然后对每个文件分别在内存中进行快速排序，再将100个小文件进行合并，并在合并过程中寻找中位数，时间复杂度是O(nlogn)

另外一种方法是，将数据按照数据空间分为0-9999999，10000000-999999999, ……大概50个部分，每一部分存入一个小文件，统计每个小文件中的元素个数，由于文件之间相对有序，可以容易得出中位数是位于哪一个文件之中，并可以得出中位数在该小文件中的排序次序，用相同的方法对小文件进行处理，当文件内容比较小的时候可以直接在内存中进行找中位数操作，对于n个随机数找k小元素的时间复杂度是O(n),所以总的时间复杂度为O(n)

5亿个数找不存在的元素

想法是：将这5亿个数据按照大小分为50部分，0-9999999, 10000000-99999999…并分别存入文件中，对于每一个文件，只用找出每个文件中不存在元素即可

转载于:https://www.cnblogs.com/qianye/archive/2012/11/29/2794533.html

找中位数最容易想到的方法就是，先对序列进行排序，取中位数，然而5亿个数要想全部读入内存需要将近2GB空间。

一种想法是采用外部排序的方法，在排序的过程中记录数据个数，找到中位数。首先采用hash() % 100,把数据分到100个文件中，然后对每个文件分别在内存中进行快速排序，再将100个小文件进行合并，并在合并过程中寻找中位数，时间复杂度是O(nlogn)

另外一种方法是，将数据按照数据空间分为0-9999999，10000000-999999999, ……大概50个部分，每一部分存入一个小文件，统计每个小文件中的元素个数，由于文件之间相对有序，可以容易得出中位数是位于哪一个文件之中，并可以得出中位数在该小文件中的排序次序，用相同的方法对小文件进行处理，当文件内容比较小的时候可以直接在内存中进行找中位数操作，对于n个随机数找k小元素的时间复杂度是O(n),所以总的时间复杂度为O(n)

5亿个数找不存在的元素

想法是：将这5亿个数据按照大小分为50部分，0-9999999, 10000000-99999999…并分别存入文件中，对于每一个文件，只用找出每个文件中不存在元素即可

猜你喜欢

转载自www.cnblogs.com/timeObjserver/p/12003463.html

【转】5亿个数找中位数

如何从 5 亿个数中找出中位数？

5亿个无序整数找中位数

求100亿个数的中位数

E1. Median on Segments（找一个数在多少个连续子序列中是中位数）

分治与递归-找k个临近中位数的数

pyhton3 汉明重量输入一个数找二进制中位数是1的个数 leetcode

贪心填数找中位数

LeetCode 寻找两个正序数组的中位数（找第k个数的变种）

找中位数

计算平均数，均方差，找中位数

腾讯笔试3：偶数个数字里面删掉一个数之后的中位数是什么

BFPTR算法（中位数的中位数算法）求n个数中第k大的数

找两个排序数组的中位数

两个排序数组找中位数

找中位数相关算法

使用Math.max和Math.min方法实现三个数中取中位数

在一个数组中找第一个出现5次的数

输出一个数的位数

面试被问傻！5亿个数大文件怎么排序？

求这样的两个数据：5位数=2*4位数，9个数字各不相同

求这样两个数据：5位数=2*4位数，9个数字各不相同。

D. Salary Changing（找中位数）

两个等长的升序序列，找合并之后的中位数

找两个有序数组中的中位数---分治法实验1

找中位数，找第k小,还存在问题

C语言实现5位数=2*4位数，9个数字互不相同

算法求n个数的中位数 C

求两个数组的中位数

从一个数据流中取出中位数

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)