图解排序算法之(桶排序)

桶排序:

桶排序(Bucket Sort)假设输入数据服从均匀分布,然后将输入数据均匀地分配到有限数量的桶中,然后对每个桶再分别排序,对每个桶再使用插入排序算法,最后将每个桶中的数据有序的组合起来。前面了解到基数排序假设输入数据属于一个小区间内的整数,而桶排序则是假设输入是由一个随机过程生成,该过程将元素均匀的分布在一个区间[a,b]上。由于桶排序和计数排序一样均对输入的数据进行了某些假设限制,因此比一般的基于比较的排序算法复杂度低。

桶排序过程

1.初始化装入连续区间元素的n个桶,每个桶用来装一段区间中的元素。

2.遍历待排序的数据,将其映射到对应的桶中,保证每个桶中的元素都在同一个区间范围中。

3.对每个桶进行排序,最终将所有桶中排好序的元素连起来。


桶排序其中也蕴含着分治的策略,联想之前的计数排序,基数排序就像是桶排序的一个特例,一个数据一个桶。并且和散列(哈希,hash)似乎也有千丝万缕的关系。

代码实现:

private static class Node {
        int key;
        Node next;
    }

    public static void bucketSort(int keys[], int bucketsize) {
        int size = keys.length;
        Node[] bucket_table = new Node[bucketsize];
        for (int i = 0; i < bucketsize; i++) {
            bucket_table[i] = new Node();
            bucket_table[i].key = 0;//链表第一个节点的key记录当前桶中的数据量
            bucket_table[i].next = null;
        }

        for (int j = 0; j < size; j++) {
            Node node = new Node();
            node.key = keys[j];
            node.next = null;
            int index = keys[j] / 10;   //计算各元素放入对应桶的编号  自行定义规则
            Node p = bucket_table[index];
            if (p.key == 0) {
                bucket_table[index].next = node;
                bucket_table[index].key++;
            } else {
                //链表插入排序
                while (p.next != null && p.next.key <= node.key) p = p.next;
                node.next = p.next;
                p.next = node;
                bucket_table[index].key++;
            }
        }
        //输出排序结果
        for (int b = 0; b < bucketsize; b++) {
            for (Node k = bucket_table[b].next; k != null; k = k.next) {
                System.out.print(k.key + " ");
            }
        }

    }

桶排序的性能:

时间消耗包括两部分一部分为初始化桶,连接排好序的桶,其时间复杂度为O(n) 一般有m<n  (m个桶)
另一部分为对桶中的元素进行排序,这部分的复杂度,通过代码中的for和while循环直接看不太容易,这样考虑:每个桶里面有ni个元素,对ni个元素进行插入排序的耗时为O(ni^2)。

于是T(n)=O(n)+∑O(ni^2),平均意义下认为ni=n/m,于是有T(n)=O(n)+m*O((n/m)^2)=O(n^2/m)+O(n)

当n=m时,T(n)=O(n)+O(n)=O(n)

对于每个桶采用其他的排序算法:m个桶,每个桶中的元素平均假设有n/m个,在上面进行基于比较的排序,复杂度不会低于n*O(n/m*lg(n/m)),平均意义下每个桶中的元素有n/m个,O(m * n/m *lg(n/m) = O(n*lg(n/m)),所以总的时间复杂度为T(n)=O(n+n*lg(n/m))

当m=n时时间复杂度为O(n),此时和计数排序一样,桶数量越多,时间效率越高,然而桶数量越多占用空间也就越大。

如上面后插链表,容易得到桶排序是稳定

猜你喜欢

转载自blog.csdn.net/qq_35119422/article/details/80721755