1. 排序算法的介绍及分类
排序也称排序算法(Sort Algorithm),排序是将一组数据,依指定的顺序进行排列的过程。
2. 算法的时间复杂度
在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间度量,记作:T(n)=O(f(n))。它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐进时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。
2.1 常见的时间复杂度
1) 常数阶O(1)
无论代码执行了多少行,只要是没有循环等复杂结构,那这个代码的时间复杂度就都是O(1)
2) 对数阶
说明:在while循环里面,每次都将 i 乘以 2,乘完之后,i 距离 n 就越来越近了。假设循环x次之后,i 就大于 2 了,此时这个循环就退出了,也就是说 2 的 x 次方等于 n,那么 x = 也就是说当循环 次以后,这个代码就结束了。因此这个代码的时间复杂度为:O() 。 O() 的这个2 时间上是根据代码变化的,i = i * 3 ,则是 O() .
3) 线性阶O(n)
说明:这段代码,for循环里面的代码会执行n遍,因此它消耗的时间是随着n的变化而变化的,因此这类代码都可以用O(n)来表示它的时间复杂度
4) 线性对数阶
说明:线性对数阶O(nlogN) 其实非常容易理解,将时间复杂度为的代码循环n遍的话,那么它的时间复杂度就是 n * ,也就是
5) 平方阶O()
说明:平方阶O(n²) 就更容易理解了,如果把 O(n) 的代码再嵌套循环一遍,它的时间复杂度就是 O(n²),这段代码其实就是嵌套了2层n循环,它的时间复杂度就是 O(n*n),即 O(n²) 如果将其中一层循环的n改成m,那它的时间复杂度就变成了 O(m*n)
6) 立方阶O()
7) k次方阶O()
8) 指数阶O()
常见的算法时间复杂度由小到大依次为:O(1)<<O(n)<<O()<O()< O() <O() ,随着问题规模n的不断增大,上述时间复杂度不断增大,算法的执行效率越低
2.2 平均时间复杂度和最坏时间复杂度
1) 平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,该算法的运行时间。
2) 最坏情况下的时间复杂度称最坏时间复杂度。一般讨论的时间复杂度均是最坏情况下的时间复杂度。 这样做的原因是:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的界限,这就保证了算法的运行时间不会比最坏情况更长。
3) 平均时间复杂度和最坏时间复杂度是否一致,和算法有关(如图:)。
相关术语解释:
1)稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面;
2)不稳定:如果a原本在b的前面,而a=b,排序之后a可能会出现在b的后面;
3)内排序:所有排序操作都在内存中完成;
4)外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;
5)时间复杂度: 一个算法执行所耗费的时间。
6)空间复杂度:运行完一个程序所需内存的大小。
7)n: 数据规模
8)k: “桶”的个数
9)In-place: 不占用额外内存
10)Out-place: 占用额外内存
2.3 算法的空间复杂度简介
1) 类似于时间复杂度的讨论,一个算法的空间复杂度(Space Complexity)定义为该算法所耗费的存储空间,它也是问题规模n的函数。
2) 空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度。有的算法需要占用的临时工作单元数与解决问题的规模n有关,它随着n的增大而增大,当n较大时,将占用较多的存储单元,例如快速排序和归并排序算法就属于这种情况
3) 在做算法分析时,主要讨论的是时间复杂度。从用户使用体验上看,更看重的程序执行的速度。一些缓存产品(redis, memcache)和算法(基数排序)本质就是用空间换时间。
3. 插入排序
3.1 思想
插入排序(Insertion Sorting)的基本思想是:把n个待排序的元素看成为一个有序表和一个无序表,开始时有序表中只包含一个元素,无序表中包含有n-1个元素,排序过程中每次从无序表中取出第一个元素,把它的排序码依次与有序表元素的排序码进行比较,将它插入到有序表中的适当位置,使之成为新的有序表。
3.2 算法描述
- 从第一个元素开始,该元素可以认为已经被排序;
- 取出下一个元素,在已经排序的元素序列中从后向前扫描;
- 如果已排序元素大于新元素,将已排序元素移到下一位置;
- 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置;
- 将新元素插入到该位置后;
- 重复步骤2~5。
3.3 代码实现
public int[] insertSort(int[] arr){
if(arr.length == 0)
return arr;
int insertVal = 0;
int insertIndex = 0;
for (int i = 1; i < arr.length; i++) {
insertVal = arr[i];
insertIndex = i - 1;
while(insertIndex >= 0 && insertVal < arr[insertIndex]){
arr[insertIndex + 1] = arr[insertIndex];
insertIndex --;
}
arr[insertIndex + 1] = insertVal;
}
return arr;
}
3.4 算法分析
平均情况:T(n) = O(), 最好情况:T(n) = O(n), 最坏情况:T(n) = O()
3.5 简单插入排序存在的问题
假设有数组 arr = {2,3,4,5,6,1} 这时需要插入的数 1(最小),这样的过程是:
{2,3,4,5,6,6}
{2,3,4,5,5,6}
{2,3,4,4,5,6}
{2,3,3,4,5,6}
{2,2,3,4,5,6}
{1,2,3,4,5,6}
结论: 当需要插入的数是较小的数时,后移的次数明显增多,对效率有影响.
4. 希尔排序
希尔排序是希尔(Donald Shell)于1959年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为缩小增量排序。
4.1 思想
希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。
希尔排序法的示意图:
4.2 代码实现
1)交换法(速度慢)
public int[] shellSort(int[] arr){
if(arr.length == 0)
return arr;
int temp = 0;
for (int gap = arr.length / 2; gap > 0 ; gap /= 2) {
for (int i = gap; i < arr.length; i++) {
//遍历各组中的所有元素(共gap组),步长gap
for (int j = i - gap; j >= 0 ; j -= gap) {
//如果当前元素大于步长后的那个元素,说明交换
if(arr[j] > arr[j + gap]){
temp = arr[j];
arr[j] = arr[j + gap];
arr[j + gap] = temp;
}
}
}
}
return arr;
}
2)移动法(速度快)
public int[] shellSort(int[] array) {
int temp, gap = array.length / 2;
while (gap > 0) {
for (int i = gap; i < array.length; i++) {
temp = array[i];
int preIndex = i - gap;
while (preIndex >= 0 && array[preIndex] > temp) {
array[preIndex + gap] = array[preIndex];
preIndex -= gap;
}
array[preIndex + gap] = temp;
}
gap /= 2;
}
return array;
}
4.3 算法分析
平均情况:T(n) =, 最好情况:T(n) = , 最坏情况:T(n) =
5. 冒泡排序
5.1 思想
冒泡排序(Bubble Sorting)的基本思想是:通过对待排序序列从前向后(从下标较小的元素开始), 依次比较相邻元素的值,若发现逆序则交换 ,使值较大的元素逐渐从前移向后部,就像水底下的气泡一样逐渐向上冒。
5.2 代码实现
//时间复杂度为O(n^2)
public int[] bubbleSort(int[] arr) {
boolean flag = false; //标识变量,表示此次循环是否进行过交换
int temp = 0;
for (int i = 0; i < arr.length - 1; i++) {
for (int j = 0; j < arr.length - 1 - i; j++) {
if (arr[j] > arr[j + 1]) {
flag = true;
temp = arr[j];
arr[j] = arr[j + 1];
arr[j + 1] = temp;
}
}
if(!flag) //在一趟排序中,一次交换都没有发生过
break;
else
flag = false; //重置flag,进行下次判断
}
return arr;
}
5.3 算法分析
平均情况:T(n) = O(), 最佳情况:T(n) = O(n) , 最差情况:T(n) = O()
6. 快速排序
6.1 思想
快速排序(Quicksort)是对冒泡排序的一种改进。(快速排序使用分治法来把一个串分成两个子串)
基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
算法描述:随机找出一个数为基准数,下面的算法取字符串的第一位数。比基准小的放左边,比基准大的放到右边。
首先 j 指向最后一个数,i 指向第一个数,j 向左移动(每次都是 j 先出发,不然最后一步和基准交换的时候会出错),找比基准小的数,i 向右移动,找到比基准大的数,i和 j 分别找到数后把两个数交换位置,直到 i 和 j 碰面时结束,这时把基准数和 i、j 同时指向的这个数交换。
这样交换完左边都是比基准小的,右边都是比较基准大的,这样就将一个数组分成了两个子数组,然后再按照同样的方法把子数组再分成更小的子数组,直到不能分解为止。
6.2 代码实现
public int[] quickSort(int[] arr, int left, int right){
if (arr.length < 1 || left < 0 || right >= arr.length || left > right)
return null;
int i = left, j = right;
while(i != j){
while (arr[j] >= arr[left] && j > i)
j --;
while (arr[i] <= arr[left] && i < j)
i ++;
if(i < j){
int temp = arr[i];
arr[i] = arr[j];
arr[j] = temp;
}
}
if(i == j){
int temp = arr[left];
arr[left] = arr[i];
arr[i] = temp;
}
quickSort(arr, left, i - 1);
quickSort(arr, i + 1, right);
return arr;
}
6.3 算法分析
平均情况:T(n) = O(nlogn), 最好情况:T(n) = O(nlogn), 最差情况:T(n) = O()
7. 选择排序
7.1 思想
选择排序(select sorting)也是一种简单的排序方法。它的基本思想是:第一次从arr[0]~arr[n-1]中选取最小值,与arr[0]交换,第二次从arr[1]~arr[n-1]中选取最小值,与arr[1]交换,第三次从arr[2]~arr[n-1]中选取最小值,与arr[2]交换,…,第i次从arr[i-1]~arr[n-1]中选取最小值,与arr[i-1]交换,…, 第n-1次从arr[n-2]~arr[n-1]中选取最小值,与arr[n-2]交换,总共通过n-1次,得到一个按排序码从小到大排列的有序序列。
7.2 代码实现
public int[] selectedSort(int[] arr) {
if(arr.length == 0)
return arr;
int temp = 0;
int index = 0;
for (int i = 0; i < arr.length - 1; i++) {
index = i;
for (int j = i + 1; j < arr.length; j++) {
if (arr[index] > arr[j])
index = j;
}
if (index != i) {
temp = arr[i];
arr[i] = arr[index];
arr[index] = temp;
}
}
return arr;
}
7.3 算法分析
平均情况:T(n) = O(), 最佳情况:T(n) = O(), 最差情况:T(n) = O()
(时间比冒泡排序短)
8. 堆排序
8.1 堆排序基本介绍
1) 堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序。
2) 堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆,。注意 : 没有要求结点的左孩子的值和右孩子的值的大小关系。
3) 每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。
4)大顶堆举例说明:
我们对堆中的结点按层进行编号,映射到数组中就是下面这个样子:
大顶堆特点:arr[i] >= arr[2*i+1] && arr[i] >= arr[2*i+2] // i 对应第几个节点,i从0开始编号
5) 小顶堆举例说明:
小顶堆:arr[i] <= arr[2*i+1] && arr[i] <= arr[2*i+2] // i 对应第几个节点,i从0开始编号
6) 一般升序采用大顶堆,降序采用小顶堆 。
8.2 堆排序基本思想
- 将待排序序列构造成一个大顶堆。
- 此时,整个序列的最大值就是堆顶的根节点。
- 将其与末尾元素进行交换,此时末尾就为最大值。
- 然后将剩余 n - 1 个元素重新构造成一个堆,这样会得到 n 个元素的次小值。如此反复执行,便能得到一个有序序列了。
可以看到在构建大顶堆的过程中,元素的个数逐渐减少,最后就得到一个有序序列了。
8.3 堆排序步骤图解说明
要求:给你一个数组{4,6,8,5,9},要求使用堆排序,将数组升序排序。
步骤一:构造初始堆。将给定无序序列构造成一个大顶堆。
①假设给定无序序列结构如下:
②此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点 arr.length / 2 - 1 = 5 / 2 = 1,也就是下面的6结点),从左至右,从下至上进行调整。
③找到第二个非叶子结点4,由于{4,9,8}中9元素最大,4和9交换。
④这时,交换导致了子根{4,5,6}结构混乱,继续调整,[4,5,6]中6最大,交换4和6.
此时,我们就将一个无序序列构造成了一个大顶堆。
步骤二:将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。
①将堆顶元素9和末尾元素4进行交换。
②重新调整结构,使其继续满足堆定义
③再将堆顶元素8与末尾元素5进行交换,得到第二大元素8
④后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序。
8.4 堆排序代码实现
public class HeapSort {
public static void main(String[] args) {
int[] arr = {1,-9,8,2,3,7,5};
int[] ints = heapSort(arr);
System.out.println(Arrays.toString(ints)); //[-9, 1, 2, 3, 5, 7, 8]
}
public static int[] heapSort(int[] arr){
int temp = 0;
//1.将无序序列构建成一个堆,根据升序降序需求选择大顶推或小顶堆
for (int i = arr.length / 2 - 1; i >= 0; i--) {
adjustHeap(arr, i, arr.length);
}
//2.将堆顶元素与末尾元素进行交换,使末尾元素最大。
// 然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。
for (int j = arr.length - 1; j > 0; j--) {
temp = arr[j];
arr[j] = arr[0];
arr[0] = temp;
adjustHeap(arr, 0, j);
}
return arr;
}
/**
* 将一个数组(二叉树),调整成一个大顶堆
*
* @parm arr :待调整的数组
* @parm i :表示非叶子结点在数组中索引
* @parm length :表示对多少个元素继续调整,length是在逐渐减少
* */
public static void adjustHeap(int arr[], int i, int length){
int temp = arr[i]; //先取出当前元素的值,保存在临时变量
//k = i * 2 + 1中,k是i结点的左子节点
for (int k = i * 2 + 1; k < length; k = k * 2 + 1) {
if(k + 1 < length && arr[k] < arr[k + 1]) //说明左子结点
k ++; //k指向右子结点
if(arr[k] > temp){ //如果子结点大于父结点
arr[i] = arr[k]; //把较大的值付给当前结点
i = k; //i指向k,继续循环比较
}else
break;
}
//当for循环结束后,已经将以i为父节点的树的最大值,放在了顶部(局部)
arr[i] = temp; //将temp值放到调整后的位置
}
}
9. 归并排序
归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治(divide-and-conquer)策略(分治法将问题分(divide)成一些小的问题然后递归求解,而治(conquer)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)。
9.1 思想
归并排序思想示意图1 - 基本思想:
说明:可以看到这种结构很像一棵完全二叉树,本文的归并排序我们采用递归去实现(也可采用迭代的方式去实现)。分阶段可以理解为就是递归拆分子序列的过程。
归并排序思想示意图2 - 合并相邻有序子序列:
再来看看治阶段,我们需要将两个已经有序的子序列合并成一个有序序列,比如上图中的最后一次合并,要将[4,5,7,8]和[1,2,3,6]两个已经有序的子序列,合并为最终序列[1,2,3,4,5,6,7,8],来看下实现步骤
9.2 代码实现
public static void main(String[] args) {
int[] array = new int[]{1,20,1,20,3,4,60,7,8,19,2,-10,0,0};
int[] temp = new int[array.length];
mergeSort(array,0,array.length - 1, temp);
System.out.println(Arrays.toString(array)); //[-10, 0, 0, 1, 1, 2, 3, 4, 7, 8, 19, 20, 20, 60]
}
/*
* 归并排序 - 分 + 合 的方法
* */
public static void mergeSort(int[] arr, int left, int right, int[] temp){
if(left < right){
int mid = (left + right) / 2;
//向左递归进行分解
mergeSort(arr, left, mid, temp);
//向右递归进行分解
mergeSort(arr, mid + 1, right, temp);
//合并
merge(arr, left, mid, right, temp);
}
}
/*
* 归并排序 - 合并的方法
*
* arr:排序的原始数组
* left:左边有序序列的初始索引
* mid:中间索引
* right:右边索引
* temp:做中转的数组
* */
public static void merge(int[] arr, int left, int mid, int right, int[] temp){
int i = left; //初始化i,左边有序序列的初始索引
int j = mid + 1; //初始化j,右边有序序列的初始索引
int t = 0; //指向temp数组的当前索引
//1.先把左右两边(有序)的数据按照规则填充到temp数组中,直到左右两边的有序序列有一边处理完毕为止
while(i <= mid && j <= right){
if(arr[i] < arr[j]){
temp[t] = arr[i];
t += 1;
i += 1;
}else{
temp[t] = arr[j];
t += 1;
j += 1;
}
}
//2.把有剩余数据的一边数据依次全部填充到temp
while(i <= mid){
temp[t] = arr[i];
t += 1;
i += 1;
}
while(j <= right){
temp[t] = arr[j];
t += 1;
j += 1;
}
//3.将temp数组的元素拷贝到arr。注意:不是每次都拷贝所有
t = 0;
int tempLeft = left;
while (tempLeft <= right){
arr[tempLeft] = temp[t];
t += 1;
tempLeft += 1;
}
}
9.3 算法分析(跟快排差不多)
平均情况:T(n) = O(nlogn), 最好情况:T(n) = O(n), 最坏情况:T(n) = O(nlogn)
10. 基数排序
10.1 基数排序(桶排序)介绍:
1) 基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是通过键值的各个位的值,将要排序的元素分配至某些“桶”中,达到排序的作用。基数排序是使用空间换时间的经典算法。
2) 基数排序法是属于稳定性的排序,基数排序法的是效率高的稳定性排序法。
3) 基数排序(Radix Sort)是桶排序的扩展。
4) 基数排序是1887年赫尔曼·何乐礼发明的。它是这样实现的:将整数按位数切割成不同的数字,然后按每个位数分别比较。
10.2 思想
1) 将所有待比较数值统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。
2) 这样说明,比较难理解,下面我们看一个图文解释,理解基数排序的步骤
10.3 代码实现(不能有负数)
/*
* 基数排序
* */
public static int[] radixSort(int[] arr){
if (arr == null || arr.length < 2)
return arr;
//找到最大的数的位数
int max = arr[0];
for (int i = 1; i < arr.length; i++) {
if(arr[i] > max)
max = arr[i];
}
int maxLength = (max + "").length();
//定义一个二维数组,表示10个桶,每个桶就是一个一维数组(长度为arr.length,防止溢出)
int[][] bucket = new int[10][arr.length];
//定义一个一维数组来记录各个桶的每次放入的数据个数
int[] bucketElementCounts = new int[10];
int digitOfElement = 0; //每个元素的位数的值
//第几轮
for (int i = 0, n = 1; i < maxLength; i++, n *= 10) {
//遍历数组中的元素
for (int j = 0; j < arr.length; j++) {
digitOfElement = arr[j] / n % 10;
bucket[digitOfElement][bucketElementCounts[digitOfElement]] = arr[j];
bucketElementCounts[digitOfElement] ++;
}
//1) 按照顺序,把桶中的元素放到数组中
int index = 0;
//k代表第k个桶
for (int k = 0; k < bucketElementCounts.length; k++) {
//2) 如果桶中有数据,放到原数组中
if(bucketElementCounts[k] != 0){
for (int l = 0; l < bucketElementCounts[k]; l++) {
arr[index ++] = bucket[k][l];
}
}
//每轮结束后,清空桶中的数据
bucketElementCounts[k] = 0;
}
}
return arr;
}
10.4算法分析
平均情况:T(n) = O(n * k), 最佳情况:T(n) = O(n * k) , 最差情况:T(n) = O(n * k)
(这篇文章讲排序讲的很不错,算法学习总结(2)——温故十大经典排序算法,本文好多动图都是从这里借鉴的哈哈)