数据结构6 - 排序算法

1. 排序算法的介绍及分类

排序也称排序算法(Sort Algorithm)，排序是将一组数据，依指定的顺序进行排列的过程。

2. 算法的时间复杂度

在进行算法分析时，语句总的执行次数T(n)是关于问题规模n的函数，进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度，也就是算法的时间度量，记作：T(n)=O(f(n))。它表示随问题规模n的增大，算法执行时间的增长率和f(n)的增长率相同，称作算法的渐进时间复杂度，简称为时间复杂度。其中f(n)是问题规模n的某个函数。

2.1 常见的时间复杂度

1) 常数阶O(1)

无论代码执行了多少行，只要是没有循环等复杂结构，那这个代码的时间复杂度就都是O(1)

2) 对数阶 $\small O(log_{2}n)$

说明：在while循环里面，每次都将 i 乘以 2，乘完之后，i 距离 n 就越来越近了。假设循环x次之后，i 就大于 2 了，此时这个循环就退出了，也就是说 2 的 x 次方等于 n，那么 x = $\small log_{2}n$ 也就是说当循环 $\small log_{2}n$ 次以后，这个代码就结束了。因此这个代码的时间复杂度为：O( $\small log_{2}n$ ) 。 O( $\small log_{2}n$ ) 的这个2 时间上是根据代码变化的，i = i * 3 ，则是 O( $\small log_{3}n$ ) .

3) 线性阶O(n)

说明：这段代码，for循环里面的代码会执行n遍，因此它消耗的时间是随着n的变化而变化的，因此这类代码都可以用O(n)来表示它的时间复杂度

4) 线性对数阶 $\small O(nlog_{2}n)$

说明：线性对数阶O(nlogN) 其实非常容易理解，将时间复杂度为 $\small O(log_{2}n)$ 的代码循环n遍的话，那么它的时间复杂度就是 n * $\small O(log_{2}n)$ ，也就是 $\small O(nlog_{2}n)$

5) 平方阶O( $\small n^{2}$ )

说明：平方阶O(n²) 就更容易理解了，如果把 O(n) 的代码再嵌套循环一遍，它的时间复杂度就是 O(n²)，这段代码其实就是嵌套了2层n循环，它的时间复杂度就是 O(n*n)，即 O(n²) 如果将其中一层循环的n改成m，那它的时间复杂度就变成了 O(m*n)

6) 立方阶O( $\small n^{3}$ )

7) k次方阶O( $\small n^{k}$ )

8) 指数阶O( $\small 2^{n}$ )

常见的算法时间复杂度由小到大依次为：O(1)＜ $\small O(log_{2}n)$ ＜O(n)＜ $\small O(nlog_{2}n)$ ＜O( $\small n^{2}$ )＜O( $\small n^{3}$ )＜ O( $\small n^{k}$ ) ＜O( $\small 2^{n}$ ) ，随着问题规模n的不断增大，上述时间复杂度不断增大，算法的执行效率越低

2.2 平均时间复杂度和最坏时间复杂度

1) 平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下，该算法的运行时间。

2) 最坏情况下的时间复杂度称最坏时间复杂度。一般讨论的时间复杂度均是最坏情况下的时间复杂度。这样做的原因是：最坏情况下的时间复杂度是算法在任何输入实例上运行时间的界限，这就保证了算法的运行时间不会比最坏情况更长。

3) 平均时间复杂度和最坏时间复杂度是否一致，和算法有关(如图：)。

相关术语解释：

1)稳定：如果a原本在b前面，而a=b，排序之后a仍然在b的前面；

2)不稳定：如果a原本在b的前面，而a=b，排序之后a可能会出现在b的后面；

3)内排序：所有排序操作都在内存中完成；

4)外排序：由于数据太大，因此把数据放在磁盘中，而排序通过磁盘和内存的数据传输才能进行；

5)时间复杂度： 一个算法执行所耗费的时间。

6)空间复杂度：运行完一个程序所需内存的大小。

7)n: 数据规模

8)k: “桶”的个数

9)In-place: 不占用额外内存

10)Out-place: 占用额外内存

2.3 算法的空间复杂度简介

1) 类似于时间复杂度的讨论，一个算法的空间复杂度(Space Complexity)定义为该算法所耗费的存储空间，它也是问题规模n的函数。

2) 空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度。有的算法需要占用的临时工作单元数与解决问题的规模n有关，它随着n的增大而增大，当n较大时，将占用较多的存储单元，例如快速排序和归并排序算法就属于这种情况

3) 在做算法分析时，主要讨论的是时间复杂度。从用户使用体验上看，更看重的程序执行的速度。一些缓存产品(redis, memcache)和算法(基数排序)本质就是用空间换时间。

3. 插入排序

3.1 思想

插入排序（Insertion Sorting）的基本思想是：把n个待排序的元素看成为一个有序表和一个无序表，开始时有序表中只包含一个元素，无序表中包含有n-1个元素，排序过程中每次从无序表中取出第一个元素，把它的排序码依次与有序表元素的排序码进行比较，将它插入到有序表中的适当位置，使之成为新的有序表。

3.2 算法描述

从第一个元素开始，该元素可以认为已经被排序；
取出下一个元素，在已经排序的元素序列中从后向前扫描；
如果已排序元素大于新元素，将已排序元素移到下一位置；
重复步骤3，直到找到已排序的元素小于或者等于新元素的位置；
将新元素插入到该位置后；
重复步骤2~5。

3.3 代码实现

    public int[] insertSort(int[] arr){
        if(arr.length == 0)
            return arr;
        int insertVal = 0;
        int insertIndex = 0;
        for (int i = 1; i < arr.length; i++) {
            insertVal = arr[i];
            insertIndex = i - 1;
            while(insertIndex >= 0 && insertVal < arr[insertIndex]){
                arr[insertIndex + 1] = arr[insertIndex];
                insertIndex --;
            }
            arr[insertIndex + 1] = insertVal;
        }
        return arr;
    }

3.4 算法分析

平均情况：T(n) = O( $\small n^{2}$ )，最好情况：T(n) = O(n)，最坏情况：T(n) = O( $\small n^{2}$ )

3.5 简单插入排序存在的问题

假设有数组 arr = {2,3,4,5,6,1} 这时需要插入的数 1(最小)，这样的过程是：

{2,3,4,5,6,6}

{2,3,4,5,5,6}

{2,3,4,4,5,6}

{2,3,3,4,5,6}

{2,2,3,4,5,6}

{1,2,3,4,5,6}

结论: 当需要插入的数是较小的数时，后移的次数明显增多，对效率有影响.

4. 希尔排序

希尔排序是希尔（Donald Shell）于1959年提出的一种排序算法。希尔排序也是一种插入排序，它是简单插入排序经过改进之后的一个更高效的版本，也称为缩小增量排序。

4.1 思想

希尔排序是把记录按下标的一定增量分组，对每组使用直接插入排序算法排序；随着增量逐渐减少，每组包含的关键词越来越多，当增量减至1时，整个文件恰被分成一组，算法便终止。

希尔排序法的示意图：

4.2 代码实现

1)交换法（速度慢）

    public int[] shellSort(int[] arr){
        if(arr.length == 0)
            return arr;
        int temp = 0;
        for (int gap = arr.length / 2; gap > 0 ; gap /= 2) {
            for (int i = gap; i < arr.length; i++) {
                //遍历各组中的所有元素（共gap组），步长gap
                for (int j = i - gap; j >= 0 ; j -= gap) {
                    //如果当前元素大于步长后的那个元素，说明交换
                    if(arr[j] > arr[j + gap]){
                        temp = arr[j];
                        arr[j] = arr[j + gap];
                        arr[j + gap] = temp;
                    }
                }
            }
        }
        return arr;
    }

2)移动法（速度快）

    public int[] shellSort(int[] array) {
        int temp, gap = array.length / 2;
        while (gap > 0) {
            for (int i = gap; i < array.length; i++) {
                temp = array[i];
                int preIndex = i - gap;
                while (preIndex >= 0 && array[preIndex] > temp) {
                    array[preIndex + gap] = array[preIndex];
                    preIndex -= gap;
                }
                array[preIndex + gap] = temp;
            }
            gap /= 2;
        }
        return array;
    }

4.3 算法分析

平均情况：T(n) = $\small O(nlog_{2}n)$ ，　最好情况：T(n) = $\small O(nlog_{2}n)$ ，最坏情况：T(n) = $\small O(nlog_{2}n)$

5. 冒泡排序

5.1 思想

冒泡排序（Bubble Sorting）的基本思想是：通过对待排序序列从前向后（从下标较小的元素开始），依次比较相邻元素的值，若发现逆序则交换，使值较大的元素逐渐从前移向后部，就像水底下的气泡一样逐渐向上冒。

5.2 代码实现

    //时间复杂度为O(n^2)
    public int[] bubbleSort(int[] arr) {
        boolean flag = false; //标识变量，表示此次循环是否进行过交换
        int temp = 0;
        for (int i = 0; i < arr.length - 1; i++) {
            for (int j = 0; j < arr.length - 1 - i; j++) {
                if (arr[j] > arr[j + 1]) {
                    flag = true;
                    temp = arr[j];
                    arr[j] = arr[j + 1];
                    arr[j + 1] = temp;
                }
            }
            if(!flag) //在一趟排序中，一次交换都没有发生过
                break;
            else
                flag = false; //重置flag，进行下次判断
        }
        return arr;
    }

5.3 算法分析

平均情况：T(n) = O( $\small n^{2}$ )，最佳情况：T(n) = O(n) ，最差情况：T(n) = O( $\small n^{2}$ )

6. 快速排序

6.1 思想

快速排序（Quicksort）是对冒泡排序的一种改进。（快速排序使用分治法来把一个串分成两个子串）

基本思想是：通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。

算法描述：随机找出一个数为基准数，下面的算法取字符串的第一位数。比基准小的放左边，比基准大的放到右边。
首先 j 指向最后一个数，i 指向第一个数，j 向左移动（每次都是 j 先出发，不然最后一步和基准交换的时候会出错），找比基准小的数，i 向右移动，找到比基准大的数，i和 j 分别找到数后把两个数交换位置，直到 i 和 j 碰面时结束，这时把基准数和 i、j 同时指向的这个数交换。
这样交换完左边都是比基准小的，右边都是比较基准大的，这样就将一个数组分成了两个子数组，然后再按照同样的方法把子数组再分成更小的子数组，直到不能分解为止。

6.2 代码实现

    public int[] quickSort(int[] arr, int left, int right){
        if (arr.length < 1 || left < 0 || right >= arr.length || left > right)
            return null;
        int i = left, j = right;
        while(i != j){
            while (arr[j] >= arr[left] && j > i)
                j --;
            while (arr[i] <= arr[left] && i < j)
                i ++;
            if(i < j){
                int temp = arr[i];
                arr[i] = arr[j];
                arr[j] = temp;
            }
        }
        if(i == j){
            int temp = arr[left];
            arr[left] = arr[i];
            arr[i] = temp;
        }
        quickSort(arr, left, i - 1);
        quickSort(arr, i + 1, right);
        return arr;
    }

6.3 算法分析

平均情况：T(n) = O(nlogn)，最好情况：T(n) = O(nlogn)，最差情况：T(n) = O( $\small n^{2}$ )

7. 选择排序

7.1 思想

选择排序（select sorting）也是一种简单的排序方法。它的基本思想是：第一次从arr[0]~arr[n-1]中选取最小值，与arr[0]交换，第二次从arr[1]~arr[n-1]中选取最小值，与arr[1]交换，第三次从arr[2]~arr[n-1]中选取最小值，与arr[2]交换，…，第i次从arr[i-1]~arr[n-1]中选取最小值，与arr[i-1]交换，…, 第n-1次从arr[n-2]~arr[n-1]中选取最小值，与arr[n-2]交换，总共通过n-1次，得到一个按排序码从小到大排列的有序序列。

7.2 代码实现

    public int[] selectedSort(int[] arr) {
        if(arr.length == 0)
            return arr;
        int temp = 0;
        int index = 0;
        for (int i = 0; i < arr.length - 1; i++) {
            index = i;
            for (int j = i + 1; j < arr.length; j++) {
                if (arr[index] > arr[j])
                    index = j;
            }
            if (index != i) {
                temp = arr[i];
                arr[i] = arr[index];
                arr[index] = temp;
            }
        }
        return arr;
    }

7.3 算法分析

平均情况：T(n) = O( $\small n^{2}$ )，最佳情况：T(n) = O( $\small n^{2}$ )，最差情况：T(n) = O( $\small n^{2}$ )

（时间比冒泡排序短）

8. 堆排序

8.1 堆排序基本介绍

1) 堆排序是利用堆这种数据结构而设计的一种排序算法，堆排序是一种选择排序，它的最坏，最好，平均时间复杂度均为O(nlogn)，它也是不稳定排序。

2) 堆是具有以下性质的完全二叉树：每个结点的值都大于或等于其左右孩子结点的值，称为大顶堆,。注意 : 没有要求结点的左孩子的值和右孩子的值的大小关系。

3) 每个结点的值都小于或等于其左右孩子结点的值，称为小顶堆。

4)大顶堆举例说明：

我们对堆中的结点按层进行编号，映射到数组中就是下面这个样子:

大顶堆特点：arr[i] >= arr[2*i+1] && arr[i] >= arr[2*i+2] // i 对应第几个节点，i从0开始编号

5) 小顶堆举例说明：

小顶堆：arr[i] <= arr[2*i+1] && arr[i] <= arr[2*i+2] // i 对应第几个节点，i从0开始编号

6) 一般升序采用大顶堆，降序采用小顶堆 。

8.2 堆排序基本思想

将待排序序列构造成一个大顶堆。
此时，整个序列的最大值就是堆顶的根节点。
将其与末尾元素进行交换，此时末尾就为最大值。
然后将剩余 n - 1 个元素重新构造成一个堆，这样会得到 n 个元素的次小值。如此反复执行，便能得到一个有序序列了。

可以看到在构建大顶堆的过程中，元素的个数逐渐减少，最后就得到一个有序序列了。

8.3 堆排序步骤图解说明

要求：给你一个数组{4,6,8,5,9}，要求使用堆排序，将数组升序排序。

步骤一：构造初始堆。将给定无序序列构造成一个大顶堆。

①假设给定无序序列结构如下：

②此时我们从最后一个非叶子结点开始（叶结点自然不用调整，第一个非叶子结点 arr.length / 2 - 1 = 5 / 2 = 1，也就是下面的6结点），从左至右，从下至上进行调整。

③找到第二个非叶子结点4，由于{4,9,8}中9元素最大，4和9交换。

④这时，交换导致了子根{4,5,6}结构混乱，继续调整，[4,5,6]中6最大，交换4和6.

此时，我们就将一个无序序列构造成了一个大顶堆。

步骤二：将堆顶元素与末尾元素进行交换，使末尾元素最大。然后继续调整堆，再将堆顶元素与末尾元素交换，得到第二大元素。如此反复进行交换、重建、交换。

①将堆顶元素9和末尾元素4进行交换。

②重新调整结构，使其继续满足堆定义

③再将堆顶元素8与末尾元素5进行交换，得到第二大元素8

④后续过程，继续进行调整，交换，如此反复进行，最终使得整个序列有序。

8.4 堆排序代码实现

public class HeapSort {
    public static void main(String[] args) {
        int[] arr = {1,-9,8,2,3,7,5};
        int[] ints = heapSort(arr);
        System.out.println(Arrays.toString(ints)); //[-9, 1, 2, 3, 5, 7, 8]
    }

    public static int[] heapSort(int[] arr){
        int temp = 0;
        //1.将无序序列构建成一个堆，根据升序降序需求选择大顶推或小顶堆
        for (int i = arr.length / 2 - 1; i >= 0; i--) {
            adjustHeap(arr, i, arr.length);
        }
        //2.将堆顶元素与末尾元素进行交换，使末尾元素最大。
        // 然后继续调整堆，再将堆顶元素与末尾元素交换，得到第二大元素。如此反复进行交换、重建、交换。
        for (int j = arr.length - 1; j > 0; j--) {
            temp = arr[j];
            arr[j] = arr[0];
            arr[0] = temp;
            adjustHeap(arr, 0, j);
        }
        return arr;
    }

    /**
     * 将一个数组（二叉树），调整成一个大顶堆
     *
     * @parm arr :待调整的数组
     * @parm i :表示非叶子结点在数组中索引
     * @parm length :表示对多少个元素继续调整，length是在逐渐减少
     * */
    public static void adjustHeap(int arr[], int i, int length){
        int temp = arr[i]; //先取出当前元素的值，保存在临时变量
        //k = i * 2 + 1中，k是i结点的左子节点
        for (int k = i * 2 + 1; k < length; k = k * 2 + 1) {
            if(k + 1 < length && arr[k] < arr[k + 1]) //说明左子结点
                k ++; //k指向右子结点
            if(arr[k] > temp){ //如果子结点大于父结点
                arr[i] = arr[k]; //把较大的值付给当前结点
                i = k; //i指向k，继续循环比较
            }else
                break;
        }
        //当for循环结束后，已经将以i为父节点的树的最大值，放在了顶部（局部）
        arr[i] = temp; //将temp值放到调整后的位置
    }
    
}

9. 归并排序

归并排序（MERGE-SORT）是利用归并的思想实现的排序方法，该算法采用经典的分治（divide-and-conquer）策略（分治法将问题分(divide)成一些小的问题然后递归求解，而治(conquer)的阶段则将分的阶段得到的各答案"修补"在一起，即分而治之)。

9.1 思想

归并排序思想示意图1 - 基本思想:

说明：可以看到这种结构很像一棵完全二叉树，本文的归并排序我们采用递归去实现（也可采用迭代的方式去实现）。分阶段可以理解为就是递归拆分子序列的过程。

归并排序思想示意图2 - 合并相邻有序子序列:

再来看看治阶段，我们需要将两个已经有序的子序列合并成一个有序序列，比如上图中的最后一次合并，要将[4,5,7,8]和[1,2,3,6]两个已经有序的子序列，合并为最终序列[1,2,3,4,5,6,7,8]，来看下实现步骤

9.2 代码实现

    public static void main(String[] args) {
        int[] array = new int[]{1,20,1,20,3,4,60,7,8,19,2,-10,0,0};
        int[] temp = new int[array.length];
        mergeSort(array,0,array.length - 1, temp);
        System.out.println(Arrays.toString(array)); //[-10, 0, 0, 1, 1, 2, 3, 4, 7, 8, 19, 20, 20, 60]

    }


    /*
    * 归并排序 - 分 + 合 的方法
    * */
    public static void mergeSort(int[] arr, int left, int right, int[] temp){
        if(left < right){
            int mid = (left + right) / 2;
            //向左递归进行分解
            mergeSort(arr, left, mid, temp);
            //向右递归进行分解
            mergeSort(arr, mid + 1, right, temp);
            //合并
            merge(arr, left, mid, right, temp);
        }
    }

    /*
    * 归并排序 - 合并的方法
    *
    * arr：排序的原始数组
    * left：左边有序序列的初始索引
    * mid：中间索引
    * right：右边索引
    * temp：做中转的数组
    * */
    public static void merge(int[] arr, int left, int mid, int right, int[] temp){
        int i = left; //初始化i，左边有序序列的初始索引
        int j = mid + 1; //初始化j，右边有序序列的初始索引
        int t = 0; //指向temp数组的当前索引
        //1.先把左右两边（有序）的数据按照规则填充到temp数组中，直到左右两边的有序序列有一边处理完毕为止
        while(i <= mid && j <= right){
            if(arr[i] < arr[j]){
                temp[t] = arr[i];
                t += 1;
                i += 1;
            }else{
                temp[t] = arr[j];
                t += 1;
                j += 1;
            }
        }
        //2.把有剩余数据的一边数据依次全部填充到temp
        while(i <= mid){
            temp[t] = arr[i];
            t += 1;
            i += 1;
        }
        while(j <= right){
            temp[t] = arr[j];
            t += 1;
            j += 1;
        }
        //3.将temp数组的元素拷贝到arr。注意：不是每次都拷贝所有
        t = 0;
        int tempLeft = left;
        while (tempLeft <= right){
            arr[tempLeft] = temp[t];
            t += 1;
            tempLeft += 1;
        }
    }

9.3 算法分析（跟快排差不多）

平均情况：T(n) = O(nlogn)，最好情况：T(n) = O(n)，最坏情况：T(n) = O(nlogn)

10. 基数排序

10.1 基数排序(桶排序)介绍:

1) 基数排序（radix sort）属于“分配式排序”（distribution sort），又称“桶子法”（bucket sort）或bin sort，顾名思义，它是通过键值的各个位的值，将要排序的元素分配至某些“桶”中，达到排序的作用。基数排序是使用空间换时间的经典算法。

2) 基数排序法是属于稳定性的排序，基数排序法的是效率高的稳定性排序法。

3) 基数排序(Radix Sort)是桶排序的扩展。

4) 基数排序是1887年赫尔曼·何乐礼发明的。它是这样实现的：将整数按位数切割成不同的数字，然后按每个位数分别比较。

10.2 思想

1) 将所有待比较数值统一为同样的数位长度，数位较短的数前面补零。然后，从最低位开始，依次进行一次排序。这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。

2) 这样说明，比较难理解，下面我们看一个图文解释，理解基数排序的步骤

10.3 代码实现（不能有负数）

     /*
    * 基数排序
    * */
    public static int[] radixSort(int[] arr){
        if (arr == null || arr.length < 2)
            return arr;
        //找到最大的数的位数
        int max = arr[0];
        for (int i = 1; i < arr.length; i++) {
            if(arr[i] > max)
                max = arr[i];
        }
        int maxLength = (max + "").length();
        //定义一个二维数组，表示10个桶，每个桶就是一个一维数组（长度为arr.length,防止溢出）
        int[][] bucket = new int[10][arr.length];
        //定义一个一维数组来记录各个桶的每次放入的数据个数
        int[] bucketElementCounts = new int[10];
        int digitOfElement = 0; //每个元素的位数的值
        //第几轮
        for (int i = 0, n = 1; i < maxLength; i++, n *= 10) {
            //遍历数组中的元素
            for (int j = 0; j < arr.length; j++) {
                digitOfElement = arr[j] / n % 10;
                bucket[digitOfElement][bucketElementCounts[digitOfElement]] = arr[j];
                bucketElementCounts[digitOfElement] ++;
            }
            //1) 按照顺序，把桶中的元素放到数组中
            int index = 0;
            //k代表第k个桶
            for (int k = 0; k < bucketElementCounts.length; k++) {
                //2) 如果桶中有数据，放到原数组中
                if(bucketElementCounts[k] != 0){
                    for (int l = 0; l < bucketElementCounts[k]; l++) {
                        arr[index ++] = bucket[k][l];
                    }
                }
                //每轮结束后，清空桶中的数据
                bucketElementCounts[k] = 0;
            }
        }
        return arr;
    }

10.4算法分析

平均情况：T(n) = O(n * k)，最佳情况：T(n) = O(n * k) ，最差情况：T(n) = O(n * k)

（这篇文章讲排序讲的很不错，算法学习总结（2）——温故十大经典排序算法，本文好多动图都是从这里借鉴的哈哈）

单椒煜泽

发布了31 篇原创文章 · 获赞 13 · 访问量 1418

私信关注