BFPRT算法-求数组中第K小的元素. - 代码天地

BFPRT算法-求数组中第K小的元素.

企业开发 2023-06-25 02:08:40 阅读次数: 0

一、实验问题简述及分析

实验问题：

求数组中第K小的元素.

问题实例：

通常我们需要在一大堆数中求前 K 大的数. 比如在搜索引擎中求当天用户点击次数排名前1000的热词; 在文本特征选择中求词频值从大到小排名的前k名问题.该问题也被称作TOP-K问题.

常规算法存在的问题：

常规算法即指利用快速排序算法进行排序，快速排序的平均时间复杂度为O(nlogn)，但存在时间复杂度为O(n²)的情况. 而且其实只需要前K小/大的数即可，不需要对其他多余的数进行排序，快速排序算法浪费了多余的排序时间.

实验过程简述及时间复杂度分析

1. BFPTR算法

BFPTR算法，又称中位数算法. 根据算法分析，它的最坏时间复杂度最差仅为O(n).其与常规方法（即快速排序算法）差距仅在每次排序中选取的排序数字的有无规定上.在常规算法中，排序数字的选取是随机的，而在BFPRT算法中，先将数组每五个相邻的分成一组，如果最后有余下不足五个的也同样分为一组，将每组当中的中位数构成一个新数组，再求得新数组的中位数，作为选取的比较数字. 由此递归求解，保证每一次的比较数字都在数组的中间位置，最终将时间复杂度减小为O(n).

本实验步骤简述

①将原数组分组，分为五个一组，最终若有剩余不足五个的情况可以也算作一组.

②对得到的每个小组内部进行排序，取其中位数，存放在新数组中.

③找出新数组的中位数，并以该数作为比较数字m*进行partiton过程，即将比m*小的数字存在S1中，比m*大的数字放在S2中.

④判断情况一：若此时k恰好等于|m*|,输出

判断情况二：若此时k>|m*|,缩短递归 BFPRT(a, low, m.position-1, int key)

扫描二维码关注公众号，回复： 15447546 查看本文章

判断情况三：若此时k<|m*|,缩短递归 BFPRT(a, m.position+1,high, int key)

图1 BFPRT算法示意图

算法的时间复杂度分析

BFPRT算法的最坏时间复杂度为O(n). 设T(n)为时间复杂度,那么很容易有如下公式：

（1）

② ③

其中 ① 来自寻找分组中的中位数， ② 则来自BFPRT（）过程，最初选择的m*首先大于中位数数组中的1/2，即总数的(1/2)*(n/5),而在这n/10的数中，它们又一定大于等于原5个小组中的3个数字，因此，在最坏的情况下，每次都选到7/10的部分 ③c*n来自其他过程,如排序.

实验问题思考及新尝试：

在算法讲解中一直使用5为数组分组，但是为什么不使用其他数字进行分组，我在试验中用程序进行了比较.

因为偶数分组不方便取中位数，因此作不考虑 .在实验中，我选择7和9对原数组进行分组，发现在数组长度相同的情况下，以5分组的计算时间普遍好于以7、9进行分组的情况.

分析原因：

首先，每组的元素越多，数据的最坏情况越坏：比如7个一组，数据最坏被4：10分即2：5分，相比3：7的情况比例更高，更加不均匀.
会造成递归次数增多.

下图分别为200点情况下取5、7、9为分组的BFPRT算法结果

5分组

7分组

9分组

经过比较可以看出，5分组算法计算时间效率普遍最高，运行时间较快。

下图分别为500点情况下取5、7、9为分组的BFPRT算法结果

5分组

7分组

9分组

同样，经过比较可以看出，5分组算法计算时间效率普遍最高，运行时间较快。

猜你喜欢

转载自blog.csdn.net/qq_52913088/article/details/127010629

BFPRT算法：求数组中第k小（大）的元素

BFPRT算法-求数组中第K小的元素.

BFPRT算法线性时间选择第k小元素

bfprt 算法 (数组中第K 小问题问题)

【最大最小堆算法】求数组中第K大的元素 / 求数据中位数

线性时间内找到第k小的元素：快排应用与BFPRT算法

线性时间找到第k小的元素：快排应用与BFPRT算法

【Leetcode 堆、快速选择、BFPRT】数组中的第K个最大元素（215）

215. 数组中的第K个最大元素 BFPRT最牛解法

求数列中的第1～k小元素

排序算法之——快速排序，以及求数组中第k小的值

第k个小的数 bfprt算法与快排改进

【Leetcode 堆、快速选择、Top-K问题 BFPRT】有序矩阵中第K小的元素（378）

找出数组中第k小的元素

JAVA算法之求数组中第N小的数据

BFPRT(无序数组中找到第k大的数，或者第k小的数）

求数组中第k个最大(小)的数，或k个最大(小)的数

求数字字符串数组中，元素取整第k大的元素

从数组a[]中找出第k小的元素.(利用快速排序中的分治算法)

求数组中第k大的数

代码优化 - 求数组中的第 K 个最大元素

求数组中第k个最小数求数组中第k个最小数

找出数组[1...n]中第k小元素

快速排序思想的应用--求数组中第k小的数

算法-找出整数数组中的第K大的元素

算法探索_数组中的第K个最大元素

求数据流中的第K大元素

数组2——查找第k小元素

从数组中找到第k小元素

找出数组第k小的元素

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

第五讲：AbstractBean以及Ioc常见注解使用和自动装配

python-re模块学习-正则表达式

黑客攻击常用手段

正则表达式的规则

windwos::mutex

Spring中日志的使用（log4j）

Bootstra5 按钮处理

JVM内存结构-这一篇全部了解

Android的低级错误

Oracle中Cursor, A表a1字段值复制到B表b1字段

每日归档

更多

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)