数据结构与算法:top K 问题

top K 问题是面试中常考的问题,往往可以用排序(排序)和堆(大/小根堆)来解决。当然,如果你只会快排的话,就可以早点面试结束回家吃饭了。

结论:

top K 问题常用堆来解决

1. 找到数组中最小的 k 个数

题目:

设计一个算法,找出数组中最小的k个数。以任意顺序返回这k个数均可。

示例:

输入: arr = [1,3,5,7,2,4,6,8], k = 4
输出: [1,2,3,4]

1.1 快排,O(nlogn),O(logn)

最容易想到的方法是快速排序,其时间复杂度为 O(nlogn),空间复杂度为 O(logn)

code:

class Solution:
    def smallestK(self, arr: List[int], k: int) -> List[int]:
        arr.sort()
        return arr[:k]

1.2 大根堆,O(nlogk),O(k)

我们用一个大根堆实时维护数组的前 k 小值。首先将前 k 个数插入大根堆中,随后从第 k+1 个数开始遍历,如果当前遍历到的数比大根堆的堆顶的数要小,就把堆顶的数弹出,再插入当前遍历到的数。最后将大根堆里的数存入数组返回即可。

由于 Python 中的 heapq库创建的堆为小根堆,因此我们要对数组中所有的数取其相反数变成大根堆。

code:

class Solution:
    def smallestK(self, arr: List[int], k: int) -> List[int]:
        if not arr or k==0:
            return []
        heap=[-x for x in arr[:k]]
        heapq.heapify(heap)
        for x in arr[k:]:
            if -heap[0]>x:
                heapq.heappop(heap)
                heapq.heappush(heap,-x)
        return [-x for x in heap]

复杂度分析:

  • 时间复杂度:O(nlogk),其中 n 是数组 arr 的长度。由于大根堆实时维护前 k 小值,所以插入删除都是 O(logk) 的时间复杂度,最坏情况下数组里 n 个数都会插入,所以一共需要 O(nlogk) 的时间复杂度。
  • 空间复杂度:O(k),因为大根堆里最多有 k 个数

相关题目持续更新中 …

猜你喜欢

转载自blog.csdn.net/qq_43799400/article/details/131753582