数据流中的中位数(ArrayList , 堆排序)

题目描述

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。我们使用Insert()方法读取数据流,使用GetMedian()方法获取当前读取数据的中位数。

思路:

方法1、ArrayList

不是说ArrayList是有序的吗???

自己太low了,这个有序 说的是它的存储方式是有序的,不是说元素是排好序的。有序的,是以数组的存储方式进行存储.也就是说数组什么样它就什么样

ArrayList 转数组(背下来):

Integer[] array = (Integer[])arrayList.toArray(new Integer[length]);

还有自带的排序方法:

Arrays.sort(array);
import java.util.*;
public class Solution {
   private List<Integer> arrayList = new ArrayList<Integer>();

    public void Insert(Integer num) {
        arrayList.add(num);
    }

    public Double GetMedian() {
        double res = 0.0;
        if(!arrayList.isEmpty()){
            int length = arrayList.size();
            
            Integer[] array = (Integer[])arrayList.toArray(new Integer[length]);
            Arrays.sort(array);
            
            if(length%2==0){
                //中间的平均值
                res = (array[length/2]+array[length/2 - 1])/2.0;
            }else{
                res =  array[length/2];
            }
        }
        return res;
    }


}

方法二:

摘自 原文:https://blog.csdn.net/ouyangyanlan/article/details/72875917

//1. 使用大顶堆+小顶堆的容器.
//2. 两个堆中的数据数目差不能超过1,这样可以使中位数只会出现在两个堆的交接处
//3. 大顶堆的所有数据都小于小顶堆,这样就满足了排序要求。平均数就在两个堆顶的数之中。

private int count = 0;
private PriorityQueue<Integer> minHeap = new PriorityQueue<>();
private PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(15, new Comparator<Integer>() {
    @Override
    public int compare(Integer o1, Integer o2) {
        return o2 - o1;
    }
});

//读入字符,放到合适位置 
public void Insert(Integer num) {
    if (count %2 == 0) {
        maxHeap.offer(num);
        int filteredMaxNum = maxHeap.poll();
        minHeap.offer(filteredMaxNum);
    } else {
        minHeap.offer(num);
        int filteredMinNum = minHeap.poll();
        maxHeap.offer(filteredMinNum);
    }
    count++;
}

//求中位数
public Double GetMedian() {
    if (count %2 == 0) {
        return new Double((minHeap.peek() + maxHeap.peek())) / 2;
    } else {
        return new Double(minHeap.peek());
    }
}

a. 为了保证两个堆中的数据数目差不能超过1,在Insert()方法中使用了count来辅助实现。
b. 为了保证小顶堆的元素都小于大顶堆的元素,借用优先队列PriorityQueue。其默认维持队列内升序排列。也可以像上面传入一个比较器,然后使其改变排列顺序。
c. 具体的实施方案。当数据总数为偶数时,新加入的元素,应当进入小根堆,注意不是直接进入小根堆,而是经大根堆筛选后取大根堆中最大元素进入小根堆;当数据总数为奇数时,新加入的元素,应当进入大根堆。注意不是直接进入大根堆,而是经小根堆筛选后取小根堆中最大元素进入大根堆。
 

猜你喜欢

转载自blog.csdn.net/qq_39474604/article/details/91949913
今日推荐