中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
进阶:
如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/find-median-from-data-stream
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
思路
双堆法:
【关于STL的堆】
使用一个大顶堆big和一个小顶堆small,存放元素,使得他们满足
- big的堆顶小于small的堆顶(左边的最大值小于右边的最小值
- big和small堆中元素个数之差不超过1
如果在插入元素的时候发生【big和small堆中元素个数之差超过1】的情况,需要将元素多的堆的堆顶移动到元素少的堆中做新堆顶,类似AVL树
我们总是刻意地,且方便地(这就是用堆的原因)取两边的最大/小值,以此决定新的元素应该插入在哪边,新元素大于左边big堆堆顶,那么插入到small堆中,反之
- 如果两堆元素之数量和为偶数,那么根据性质2,他们两边有相同个数的元素,中位数就是big的堆顶和small的堆顶的平均
- 如果两堆元素数量之和为奇数,那么中位数位于元素多的堆的堆顶
代码
class MedianFinder {
public:
vector<int> big;
vector<int> small;
/** initialize your data structure here. */
MedianFinder()
{
}
void addNum(int num)
{
int lmax = (big.size()==0)?(INT_MAX):(big[0]);
if(lmax<num)
{
small.push_back(num);
push_heap(small.begin(), small.end(), greater<int>());
}
else
{
big.push_back(num);
push_heap(big.begin(), big.end(), less<int>());
}
if(fabs(big.size()-small.size())>1)
{
if(big.size()>small.size())
{
small.push_back(big[0]);
push_heap(small.begin(), small.end(), greater<int>());
pop_heap(big.begin(), big.end(), less<int>());
big.pop_back();
}
else if(small.size()>big.size())
{
big.push_back(small[0]);
push_heap(big.begin(), big.end(), less<int>());
pop_heap(small.begin(), small.end(), greater<int>());
small.pop_back();
}
}
}
double findMedian()
{
if((big.size()+small.size())%2==0)
return (double)(big[0]+small[0])/2;
return (big.size()>small.size())?(big[0]):(small[0]);
}
};
/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder* obj = new MedianFinder();
* obj->addNum(num);
* double param_2 = obj->findMedian();
*/