一、题目描述
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。
二、解题思路
大顶堆:根结点的关键字大于等于左右子树的关键字值。
小顶堆:根结点的关键字小于等于左右子树的关键字值。
采用大顶堆 + 小顶堆,满足两点:
1)两个堆中数据的数目之差不能超过1,这样中位数只会出现在两个堆的交接处。
规定插入前总数目是偶数时将新数据插入到大顶堆中,奇数时插入到小顶堆中。
2)保证大顶堆中所有数据小于小顶堆中数据。
在插入新的数据时,需先和大顶堆堆顶或者小顶堆堆顶进行比较。
a. 插入前总数为偶数时,数据会被插入到大顶堆中。首先判断新数据和小顶堆堆顶大小,如果小顶堆堆顶数据小,那么将新数据插入小顶堆,然后弹出小顶堆堆顶再插入到大顶堆中;如果新数据小,则直接插入大顶堆成为堆顶。
b. 插入前总数为奇数时,数据会被插入到小顶堆中。首先判断新数据和大顶堆堆顶大小,如果大顶堆堆顶数据大,那么将新数据插入大顶堆,然后弹出大顶堆堆顶再插入到小顶堆中;如果新数据大,则直接插入小顶堆成为堆顶。
例如:
插入前总数为偶数,此时新数据为4
大顶堆 小顶堆
[3] [5]
[2] [1] [7] [8]
4与5进行比较,4<5,将4直接插入大顶堆
大顶堆 小顶堆
[4] [5]
[3] [2] [7] [8]
[1]
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
插入前总数为偶数,此时新数据为6
大顶堆 小顶堆
[3] [5]
[2] [1] [7] [8]
6与5进行比较,6>5,将6插入小顶堆,弹出堆顶5插入大顶堆
大顶堆 小顶堆
[5] [6]
[3] [2] [7] [8]
[1]
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
插入前总数为奇数,此时新数据为5
大顶堆 小顶堆
[4] [6]
[2] [1] [7]
5与4进行比较,5>4,将5直接插入小顶堆
大顶堆 小顶堆
[4] [5]
[2] [1] [6] [7]
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
插入前总数为奇数,此时新数据为3
大顶堆 小顶堆
[4] [6]
[2] [1] [7]
3与4进行比较,3<4,将3插入大顶堆,弹出堆顶4插入小顶堆
大顶堆 小顶堆
[3] [4]
[2] [1] [6] [7]
三、编程实现
import java.util.Comparator;
import java.util.PriorityQueue;
public class Solution {
int count;
PriorityQueue<Integer> minHeap = new PriorityQueue<>();
// private static final int DEFAULT_INITIAL_CAPACITY = 11;
PriorityQueue<Integer> maxHeap = new PriorityQueue<>(11, new Comparator<Integer>() {
@Override
public int compare(Integer o1, Integer o2) {
// PriorityQueue默认是小顶堆,实现大顶堆,需要反转默认排序器
return o2.compareTo(o1);
}
});
public void Insert(Integer num) {
count++;
// 当插入前总数为奇数时,count为偶数
if (count % 2 == 0) {
// 如果大顶堆堆顶较大
if (!maxHeap.isEmpty() && num < maxHeap.peek()) {
// 将新的数据插入大顶堆并且弹出堆顶
maxHeap.offer(num);
num = maxHeap.poll();
}
// 将值插入到小顶堆
minHeap.offer(num);
} else {
// 当插入前总数为偶数时,如果小顶堆堆顶较小
if (!minHeap.isEmpty() && num > minHeap.peek()) {
// 将新的数据插入小顶堆并且弹出堆顶
minHeap.offer(num);
num = minHeap.poll();
}
// 将值插入大顶堆
maxHeap.offer(num);
}
}
public Double GetMedian() {
double result;
if (count % 2 == 1) {
// 总数为奇数时,中位数就是大顶堆堆顶
result = maxHeap.peek();
} else {
// 总数为偶数时,中位数为大顶堆小顶堆堆顶的平均值
result = (minHeap.peek() + maxHeap.peek()) / 2.0;
}
return result;
}
}