数据结构6 - 排序算法

1. 排序算法的介绍及分类

排序也称排序算法(Sort Algorithm)排序是将数据,依指定的顺序进行排过程。

2. 算法的时间复杂度

在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间度量,记作:T(n)=O(f(n))。它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐进时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。

2.1 常见的时间复杂度

1) 数阶O(1)

论代码执行了多少行,只要是没有循环等复杂结构,那这个代码的时间复杂度就都是O(1)

2) 对数阶\small O(log_{2}n)

说明:在while循环里面,每次都将 i 乘以 2,乘完之后,i 距离 n 就越来越近了。假设循环x次之后,i 就大于 2 了,此时这个循环就退出了,也就是说 2 x 次方等于 n,那么 x = \small log_{2}n就是说当循环 \small log_{2}n 次以后,这个代码就结束了。因此这个代码的时间复杂度为:O(\small log_{2}n O(\small log_{2}n) 的这个2 时间上是根据代码变化的,i = i * 3 ,则是 O(\small log_{3}n) .

3) 线性阶O(n)

说明:这段代码,for循环里面的代码会执行n遍,因此它消耗的时间是随着n的变化而变化的,因此这类代码都可以用O(n)来表示它的时间复杂度

4) 线性对数阶\small O(nlog_{2}n)

说明:线性对数阶O(nlogN) 其实非常容易理解,将时间复杂度为\small O(log_{2}n)的代码循环n遍的话,那么它的时间复杂度就是 n * \small O(log_{2}n),也就是\small O(nlog_{2}n)

5) 方阶O(\small n^{2})

说明:平方阶O(n²) 就更容易理解了,如果把 O(n) 的代码再嵌套循环一遍,它的时间复杂度就是 O(n²)这段代码其实就是嵌套了2n循环,它的时间复杂度就是 O(n*n),即  O(n²) 果将其中一层循环的n改成m那它的时间复杂度就变成了 O(m*n)

6) 方阶O(\small n^{3})

7) k次方阶O(\small n^{k})

8) 数阶O(\small 2^{n})

常见的算法时间复杂度由小到大依次为:O(1)\small O(log_{2}n)O(n)\small O(nlog_{2}n)O(\small n^{2})O(\small n^{3})O(\small n^{k})O(\small 2^{n}) ,随着问题规模n的不断增大,上述时间复杂度不断增大,算法的执行效率越

2.2 平均时间复杂度和最坏时间复杂度

1) 均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,该算法的运行时间

2) 坏情况下的时间复杂度称最坏时间复杂度。一般讨论的时间复杂度均是最坏情况下的时间复杂度。 这样做的原因是:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的界限,这就保证了算法的运行时间不会比最坏情况更长

3) 平均时间复杂度和坏时间复杂度否一致,和算法有关(如图:)

相关术语解释:

1):如果a原本在b前面,而a=b,排序之后a仍然在b的前面

2)稳定:如果a原本在b的前面,而a=b,排序之后a可能会出现在b的后面

3)排序:所有排序操作都在内存中完成

4)排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行

5)间复杂度: 一个算法执行所耗费的时间

6)间复杂度:运行完一个程序所需内存的大小

7)n: 数据规

8)k: 桶”的个

9)In-place:    不占用额外内

10)Out-place: 占用额外内存

2.3 算法的空间复杂度简介

1) 似于时间复杂度的讨论,一个算法的空间复杂度(Space Complexity)义为该算法所耗费的存储空间,它也是问题规模n的函数

2) 空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度。有的算法需要占用的临时工作单元数与解决问题的规模n有关,它随着n的增大而增大,当n较大时,将占用较多的存储单元,例如快速排序和归并排序算法就属于这种情

3) 在做算法分析时,主要讨论的是时间复杂度。从用户使用体验上看,更看重的程序执行的速度。一些缓存产品(redis, memcache)和算法(基数排序)本质就是用空间换时间。

3. 插入排序

3.1 思想

入排序(Insertion Sorting)的基本思想是:把n个待排序的元素看成为一个有序表和一个无序表,开始时有序表中只包含一个元素,无序表中包含有n-1个元素排序过程中每次从无序表中取出第一个元素,把它的排序码依次与有序表元素的排序码进行比较,将它插入到有序表中的适当位置,使之成为新的有序表。

3.2 算法描述

  • 从第一个元素开始,该元素可以认为已经被排序;
  • 取出下一个元素,在已经排序的元素序列中从后向前扫描;
  • 如果已排序元素大于新元素,将已排序元素移到下一位置;
  • 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置;
  • 将新元素插入到该位置后;
  • 重复步骤2~5。

3.3 代码实现

    public int[] insertSort(int[] arr){
        if(arr.length == 0)
            return arr;
        int insertVal = 0;
        int insertIndex = 0;
        for (int i = 1; i < arr.length; i++) {
            insertVal = arr[i];
            insertIndex = i - 1;
            while(insertIndex >= 0 && insertVal < arr[insertIndex]){
                arr[insertIndex + 1] = arr[insertIndex];
                insertIndex --;
            }
            arr[insertIndex + 1] = insertVal;
        }
        return arr;
    }

3.4 算法分析

平均情况:T(n) = O(\small n^{2}), 最好情况:T(n) = O(n),   最坏情况:T(n) = O(\small n^{2})   

3.5 简单插入排序存在的问题

假设有数组 arr = {2,3,4,5,6,1} 这时需要插入的数 1(最小),这样的过程是:

{2,3,4,5,6,6}

{2,3,4,5,5,6}

{2,3,4,4,5,6}

{2,3,3,4,5,6}

{2,2,3,4,5,6}

{1,2,3,4,5,6}

: 当需要插入的数是较小的数时,后移的次数明显增多,对效率有影响.

4. 希尔排序

尔排序是希尔(Donald Shell)于1959年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为缩小增量排

4.1 思想

尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止

希尔排序法的示意图:

4.2 代码实现

1)交换法(速度慢)

    public int[] shellSort(int[] arr){
        if(arr.length == 0)
            return arr;
        int temp = 0;
        for (int gap = arr.length / 2; gap > 0 ; gap /= 2) {
            for (int i = gap; i < arr.length; i++) {
                //遍历各组中的所有元素(共gap组),步长gap
                for (int j = i - gap; j >= 0 ; j -= gap) {
                    //如果当前元素大于步长后的那个元素,说明交换
                    if(arr[j] > arr[j + gap]){
                        temp = arr[j];
                        arr[j] = arr[j + gap];
                        arr[j + gap] = temp;
                    }
                }
            }
        }
        return arr;
    }

2)移动法(速度快)

    public int[] shellSort(int[] array) {
        int temp, gap = array.length / 2;
        while (gap > 0) {
            for (int i = gap; i < array.length; i++) {
                temp = array[i];
                int preIndex = i - gap;
                while (preIndex >= 0 && array[preIndex] > temp) {
                    array[preIndex + gap] = array[preIndex];
                    preIndex -= gap;
                }
                array[preIndex + gap] = temp;
            }
            gap /= 2;
        }
        return array;
    }

4.3 算法分析

平均情况:T(n) =\small O(nlog_{2}n), 最好情况:T(n) = \small O(nlog_{2}n),   最坏情况:T(n) = \small O(nlog_{2}n)   

5. 冒泡排序

5.1 思想

冒泡排序(Bubble Sorting)的基本思想是:通过对待排序序列从前向从下标较小的元素开始), 依次比较相邻元素的值,若发现逆序则交换 ,使大的元素逐渐从移向后部,就像水底下的气泡一样逐渐向上冒

5.2 代码实现

    //时间复杂度为O(n^2)
    public int[] bubbleSort(int[] arr) {
        boolean flag = false; //标识变量,表示此次循环是否进行过交换
        int temp = 0;
        for (int i = 0; i < arr.length - 1; i++) {
            for (int j = 0; j < arr.length - 1 - i; j++) {
                if (arr[j] > arr[j + 1]) {
                    flag = true;
                    temp = arr[j];
                    arr[j] = arr[j + 1];
                    arr[j + 1] = temp;
                }
            }
            if(!flag) //在一趟排序中,一次交换都没有发生过
                break;
            else
                flag = false; //重置flag,进行下次判断
        }
        return arr;
    }

5.3 算法分析

平均情况:T(n) = O(\small n^{2}), 最佳情况:T(n) = O(n) ,  最差情况:T(n) = O(\small n^{2})  

6. 快速排序

6.1 思想

速排序(Quicksort)是对冒泡排序的一种改进。(快速排序使用分治法来把一个串分成两个子串) 

本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。

算法描述:随机找出一个数为基准数,下面的算法取字符串的第一位数。比基准小的放左边,比基准大的放到右边。
首先 j 指向最后一个数,i 指向第一个数,j 向左移动(每次都是 j 先出发,不然最后一步和基准交换的时候会出错),找比基准小的数,i 向右移动,找到比基准大的数,i和 j 分别找到数后把两个数交换位置,直到 i 和 j 碰面时结束,这时把基准数和 i、j 同时指向的这个数交换。
这样交换完左边都是比基准小的,右边都是比较基准大的,这样就将一个数组分成了两个子数组,然后再按照同样的方法把子数组再分成更小的子数组,直到不能分解为止。
 

6.2 代码实现

    public int[] quickSort(int[] arr, int left, int right){
        if (arr.length < 1 || left < 0 || right >= arr.length || left > right)
            return null;
        int i = left, j = right;
        while(i != j){
            while (arr[j] >= arr[left] && j > i)
                j --;
            while (arr[i] <= arr[left] && i < j)
                i ++;
            if(i < j){
                int temp = arr[i];
                arr[i] = arr[j];
                arr[j] = temp;
            }
        }
        if(i == j){
            int temp = arr[left];
            arr[left] = arr[i];
            arr[i] = temp;
        }
        quickSort(arr, left, i - 1);
        quickSort(arr, i + 1, right);
        return arr;
    }

6.3 算法分析

平均情况:T(n) = O(nlogn), 最好情况:T(n) = O(nlogn), 最差情况:T(n) = O(\small n^{2})   

7. 选择排序

7.1 思想

选择排序(select sorting)也是一种简单的排序方法。它的基本思想是:第一次arr[0]~arr[n-1]中选取最小值,arr[0]交换,第二次arr[1]~arr[n-1]中选取最小值,arr[1]交换,第三次arr[2]~arr[n-1]中选取最小值,arr[2]交换,,第iarr[i-1]~arr[n-1]中选取最小值,arr[i-1]交换,…, n-1arr[n-2]~arr[n-1]中选取最小值,arr[n-2]交换,总共通过n-1次,得到一个按排序码从小到大排列的有序序列。

7.2 代码实现

    public int[] selectedSort(int[] arr) {
        if(arr.length == 0)
            return arr;
        int temp = 0;
        int index = 0;
        for (int i = 0; i < arr.length - 1; i++) {
            index = i;
            for (int j = i + 1; j < arr.length; j++) {
                if (arr[index] > arr[j])
                    index = j;
            }
            if (index != i) {
                temp = arr[i];
                arr[i] = arr[index];
                arr[index] = temp;
            }
        }
        return arr;
    }

7.3 算法分析

平均情况:T(n) = O(\small n^{2}),  最佳情况:T(n) = O(\small n^{2}),   最差情况:T(n) = O(\small n^{2})   

(时间比冒泡排序短)

8. 堆排序

8.1 堆排序基本介绍

1) 排序是利用这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序

2) 是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶,。 : 有要求结点的左孩子的值右孩子的值的大小关系。

3) 个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。

4)大顶堆举例说明:

我们对堆中的结点按层进行编号,映射到数组中就是下面这个样:

大顶特点arr[i] >= arr[2*i+1] && arr[i] >= arr[2*i+2]  // i 对应第几个节点,i0开始编号

5) 小顶堆举例说明:

顶堆:arr[i] <= arr[2*i+1] && arr[i] <= arr[2*i+2] // i 对应第几个节点,i0开始编

6) 升序采用大顶堆降序采用小顶堆 

8.2 堆排序基本思想

  • 待排序序列构造成一个大顶堆。
  • 时,整个序列的最大值就是堆顶的根节点
  • 其与末尾元素进行交换,此时末尾就为最大值
  • 后将剩余 n - 1 个元素重新构造成一个堆,这样会得到 个元素的次小值。如此反复执行,便能得到一个有序序列了。

可以看到在构建大顶堆的过程中,元素的个数逐渐减少,最后就得到一个有序序列了。

8.3 堆排序步骤图解说明

要求:给你一个数组{4,6,8,5,9},要求使用堆排序,将数组升序排序。

步骤一:构造初始堆。将给定无序序列构造成一个大顶堆

①假设给定无序序列结构如下:

②此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点 arr.length / 2 - 1 = 5 / 2 = 1,也就是下面的6结点),从左至右,从下至上进行调整。

③找到第二个非叶子结点4,由于{4,9,8}中9元素最大,4和9交换。

④这时,交换导致了子根{4,5,6}结构混乱,继续调整,[4,5,6]中6最大,交换4和6.

此时,我们就将一个无序序列构造成了一个大顶堆。

步骤二将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。

①将堆顶元素9和末尾元素4进行交换。

②重新调整结构,使其继续满足堆定义

③再将堆顶元素8与末尾元素5进行交换,得到第二大元素8

④后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序。

8.4 堆排序代码实现

public class HeapSort {
    public static void main(String[] args) {
        int[] arr = {1,-9,8,2,3,7,5};
        int[] ints = heapSort(arr);
        System.out.println(Arrays.toString(ints)); //[-9, 1, 2, 3, 5, 7, 8]
    }

    public static int[] heapSort(int[] arr){
        int temp = 0;
        //1.将无序序列构建成一个堆,根据升序降序需求选择大顶推或小顶堆
        for (int i = arr.length / 2 - 1; i >= 0; i--) {
            adjustHeap(arr, i, arr.length);
        }
        //2.将堆顶元素与末尾元素进行交换,使末尾元素最大。
        // 然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。
        for (int j = arr.length - 1; j > 0; j--) {
            temp = arr[j];
            arr[j] = arr[0];
            arr[0] = temp;
            adjustHeap(arr, 0, j);
        }
        return arr;
    }

    /**
     * 将一个数组(二叉树),调整成一个大顶堆
     *
     * @parm arr :待调整的数组
     * @parm i :表示非叶子结点在数组中索引
     * @parm length :表示对多少个元素继续调整,length是在逐渐减少
     * */
    public static void adjustHeap(int arr[], int i, int length){
        int temp = arr[i]; //先取出当前元素的值,保存在临时变量
        //k = i * 2 + 1中,k是i结点的左子节点
        for (int k = i * 2 + 1; k < length; k = k * 2 + 1) {
            if(k + 1 < length && arr[k] < arr[k + 1]) //说明左子结点
                k ++; //k指向右子结点
            if(arr[k] > temp){ //如果子结点大于父结点
                arr[i] = arr[k]; //把较大的值付给当前结点
                i = k; //i指向k,继续循环比较
            }else
                break;
        }
        //当for循环结束后,已经将以i为父节点的树的最大值,放在了顶部(局部)
        arr[i] = temp; //将temp值放到调整后的位置
    }
    
}

9. 归并排序

并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治divide-and-conquer)策略(分治法将问题(divide)成一些小的问题然后递归求解,而(conquer)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)

9.1 思想

归并排序思想示意图1 - 基本思想:

说明:可以看到这种结构很像一棵完全二叉树,本文的归并排序我们采用递归去实现(也可采用迭代的方式去实现)。阶段可以理解为就是递归拆分子序列的过

归并排序思想示意图2 - 并相邻有序子序列:

再来看看阶段,我们需要将两个已经有序的子序列合并成一个有序序列,比如上图中的最后一次合并,要将[4,5,7,8][1,2,3,6]两个已经有序的子序列,合并为最终序列[1,2,3,4,5,6,7,8],来看下实现步骤

9.2 代码实现

    public static void main(String[] args) {
        int[] array = new int[]{1,20,1,20,3,4,60,7,8,19,2,-10,0,0};
        int[] temp = new int[array.length];
        mergeSort(array,0,array.length - 1, temp);
        System.out.println(Arrays.toString(array)); //[-10, 0, 0, 1, 1, 2, 3, 4, 7, 8, 19, 20, 20, 60]

    }


    /*
    * 归并排序 - 分 + 合 的方法
    * */
    public static void mergeSort(int[] arr, int left, int right, int[] temp){
        if(left < right){
            int mid = (left + right) / 2;
            //向左递归进行分解
            mergeSort(arr, left, mid, temp);
            //向右递归进行分解
            mergeSort(arr, mid + 1, right, temp);
            //合并
            merge(arr, left, mid, right, temp);
        }
    }

    /*
    * 归并排序 - 合并的方法
    *
    * arr:排序的原始数组
    * left:左边有序序列的初始索引
    * mid:中间索引
    * right:右边索引
    * temp:做中转的数组
    * */
    public static void merge(int[] arr, int left, int mid, int right, int[] temp){
        int i = left; //初始化i,左边有序序列的初始索引
        int j = mid + 1; //初始化j,右边有序序列的初始索引
        int t = 0; //指向temp数组的当前索引
        //1.先把左右两边(有序)的数据按照规则填充到temp数组中,直到左右两边的有序序列有一边处理完毕为止
        while(i <= mid && j <= right){
            if(arr[i] < arr[j]){
                temp[t] = arr[i];
                t += 1;
                i += 1;
            }else{
                temp[t] = arr[j];
                t += 1;
                j += 1;
            }
        }
        //2.把有剩余数据的一边数据依次全部填充到temp
        while(i <= mid){
            temp[t] = arr[i];
            t += 1;
            i += 1;
        }
        while(j <= right){
            temp[t] = arr[j];
            t += 1;
            j += 1;
        }
        //3.将temp数组的元素拷贝到arr。注意:不是每次都拷贝所有
        t = 0;
        int tempLeft = left;
        while (tempLeft <= right){
            arr[tempLeft] = temp[t];
            t += 1;
            tempLeft += 1;
        }
    }

9.3 算法分析(跟快排差不多)

平均情况:T(n) = O(nlogn),  最好情况:T(n) = O(n),   最坏情况:T(n) = O(nlogn)  

10. 基数排序

10.1 基数排序(桶排序)介绍:

1) 数排序radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它通过键值的各个位的值,将要排序的元素分配至某些“桶”中,达到排序的作用。基数排序是使用空间换时间的经典算法。

2) 数排序法是属于稳定性的排序,基数排序法的是效率高的稳定性排序法。

3) 基数排序(Radix Sort)桶排序的扩展。

4) 基数排序是1887年赫尔曼·何乐礼发明的。它是这样实现的将整数按位数切割成不同的数字,然后按每个位数分别比

10.2 思想

1) 将所有待比较数值统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。

2) 样说明,比较难理解,下面我们看一个图文解释,理解基数排序的步骤

10.3 代码实现(不能有负数)

     /*
    * 基数排序
    * */
    public static int[] radixSort(int[] arr){
        if (arr == null || arr.length < 2)
            return arr;
        //找到最大的数的位数
        int max = arr[0];
        for (int i = 1; i < arr.length; i++) {
            if(arr[i] > max)
                max = arr[i];
        }
        int maxLength = (max + "").length();
        //定义一个二维数组,表示10个桶,每个桶就是一个一维数组(长度为arr.length,防止溢出)
        int[][] bucket = new int[10][arr.length];
        //定义一个一维数组来记录各个桶的每次放入的数据个数
        int[] bucketElementCounts = new int[10];
        int digitOfElement = 0; //每个元素的位数的值
        //第几轮
        for (int i = 0, n = 1; i < maxLength; i++, n *= 10) {
            //遍历数组中的元素
            for (int j = 0; j < arr.length; j++) {
                digitOfElement = arr[j] / n % 10;
                bucket[digitOfElement][bucketElementCounts[digitOfElement]] = arr[j];
                bucketElementCounts[digitOfElement] ++;
            }
            //1) 按照顺序,把桶中的元素放到数组中
            int index = 0;
            //k代表第k个桶
            for (int k = 0; k < bucketElementCounts.length; k++) {
                //2) 如果桶中有数据,放到原数组中
                if(bucketElementCounts[k] != 0){
                    for (int l = 0; l < bucketElementCounts[k]; l++) {
                        arr[index ++] = bucket[k][l];
                    }
                }
                //每轮结束后,清空桶中的数据
                bucketElementCounts[k] = 0;
            }
        }
        return arr;
    }

10.4算法分析

平均情况:T(n) = O(n * k),  最佳情况:T(n) = O(n * k) ,  最差情况:T(n) = O(n * k)  


(这篇文章讲排序讲的很不错,算法学习总结(2)——温故十大经典排序算法,本文好多动图都是从这里借鉴的哈哈)

发布了31 篇原创文章 · 获赞 13 · 访问量 1418

猜你喜欢

转载自blog.csdn.net/weixin_44210965/article/details/102014164