利用python heapq模块求解Top-K问题 - 代码天地

利用python heapq模块求解Top-K问题

其他 2018-08-06 15:42:41 阅读次数: 0

Top-K问题：如何从海量数据中找出前k大数？
在python中集成了heapq模块，它提供基于堆的优先排序算法相关操作。其中，heapq.nlargest(n, iterable) 和 heapq.nsmallest(n, iterable)方法返回列表中的n个最大值和最小值。

补充：堆的逻辑结构就是完全二叉树，并且二叉树中父节点的值小于等于该节点的所有子节点的值。这种实现可以使用 heap[k] <= heap[2k+1] 并且 heap[k] <= heap[2k+2] （其中 k 为索引，从 0 开始计数）的形式体现，对于堆来说，最小元素即为根元素 heap[0]。

小顶堆解决Top K问题的思路：小顶堆维护当前扫描到的最大100个数，其后每一次的扫描到的元素，若大于堆顶，则入堆，然后删除堆顶；依此往复，直至扫描完所有元素。
python代码如下：

class solution:
    def topk(self, inputs, k):
        import heapq
        if inputs == None or len(inputs) < k or len(inputs) <= 0 or k <= 0:# 注意极限条件的确定
            return []
        output = []
        for number in inputs:
            if len(output) < k:
                output.append(number)
            else:
                output = heapq.nlargest(k, output)
                if number >= output[0]:
                    continue
                else:
                    output[0] = number
        return output[::-1]    
inputs = [4,5,1,6,2,7,3,8]
s = solution()
print(s.topk(inputs, 3))

猜你喜欢

转载自blog.csdn.net/zztingfeng/article/details/80615531

利用python heapq模块求解Top-K问题

Python解决top-k问题

MapReduce Top-K问题

堆的top-k问题

BFPRT 算法 (TOP-K 问题)——本质就是在利用分组中位数的中位数来找到较快排更合适的pivot元素

python 中的堆（heapq 模块）应用：Merge K Sorted Lists

python-heapq模块

Python heapq模块

python heapq模块使用

Python之heapq模块

Python模块之heapq

BFPRT算法（TOP-K问题）

经典问题：Top-K （转载）

Top-K问题详解版

堆排序详解+TOP-K问题

【堆的应用】TOP-K问题

堆的应用：Top-K问题

面试题 : Top-k问题

数据结构 | TOP-K问题

Python 利用heapq实现prim算法求解最小生成树 MST 并用graphviz直观表示

面试题：利用堆排序实现从n个数字中找出前top-k大的数字

python PriorityQueue模块 heapq模块

利用python，求解数独

Top-K 运算

top k问题python解

Python中的堆：heapq模块

Python 利用heapq和并查集实现kruskal算法求解最小生成树 MST 并用graphviz直观表示

BFPRT算法之解决Top-K问题

基于PriorityQueue(优先队列)解决TOP-K问题

Java中用优先队列解决top-K问题

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)