前言
-
排序算法集合
-
https://visualgo.net/zh:常用的算法在这里可以看到
排序算法
冒泡排序
冒泡排序也被称为下沉排序,是一个简单的排序算法,通过多次重复比较每对相邻的元素,并按规定的顺序交换他们,最终把数列进行排好序。一直重复下去,直到结束。该算法得名于较小元素“气泡”会“浮到”列表顶部。由于只使用了比较操作,所以这是一个比较排序。
冒泡排序算法的运作如下:
-
比较相邻的元素。如果第一个比第二个大,就交换他们两个。
-
对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。
-
针对所有的元素重复以上的步骤,除了最后一个。
-
持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。
由于它的简洁,冒泡排序通常被用来对于程序设计入门的学生介绍算法的概念。但同样简单的插入排序比冒泡排序性能更好,所以有些人认为不需要再教冒泡排序了。
最坏情况时间复杂度:O(n^2)
最好情况时间复杂度: O(n)
平均情况时间复杂度:O(n^2)
最坏情况空间复杂度:O(1) 辅助空间
双向冒泡排序
鸡尾酒排序,也称为双向冒泡排序、调酒器排序、搅拌排序(可以参考选择排序的一个变种)、纹波排序、接送排序,或欢乐时光排序。它由冒泡排序变化而来,是一种稳定的比较排序算法。该算法不同于冒泡排序,它在排序上由两个方向同时进行。该排序算法只是比冒泡排序稍难实现,但解决了冒泡排序中的“乌龟问题”(数组尾部的小值)。
首先从左向右方向为大元素移动方向,从右向左方向为小元素移动方向,然后每个元素都依次执行。在第 i 次移动后,前 i 个元素和后个 i 元素都放到了正确的位置,也不需要在检查一次。每次缩短已排序的那部分列表,都可以减半操作次数。
但是在乱数序列的状态下,双向冒泡排序与冒泡排序的效率都很差劲。
最坏情况时间复杂度:O(n^2)
最好情况时间复杂度: O(n)
平均情况时间复杂度:O(n^2)
最坏情况空间复杂度:O(1) 辅助空间
桶排序
桶排序,或称为箱排序,是一种把数列划分成若干个桶的排序算法。在每个桶内各自排序,或者使用不同的排序算法,或通过递归方式继续使用桶排序算法。这是一个分布排序,是最能体现出数字意义的一种基数排序。桶排序是鸽巢排序的一种归纳结果。当要被排序的数组内的数值是均匀分配的时候,桶排序使用线性时间(Θ(n))。但桶排序并不是 比较排序,他不受到 O(n log n) 下限的影响。
桶排序的流程:
-
设置一个定量的数组当作空桶子。
-
寻访串行,并且把项目一个一个放到对应的桶子去。
-
对每个不是空的桶子进行排序。
-
从不是空的桶子里把项目再放回原来的串行中。
最坏情况时间复杂度:O(n^2.k)
最好情况时间复杂度:-
平均情况时间复杂度:O(n.k)
最坏情况空间复杂度:O(n.k)
梳排序
梳排序是一个相对简单的排序算法,最初它由Wlodzimierz Dobosiewicz于1980年设计出来。后来由斯蒂芬和理查德重新发现和推广。他们的文章在1991年4月发表在字节杂志上。梳排序改善了冒泡排序和类似快速排序的竞争算法。其要旨在于消除乌龟,亦即在阵列尾部的小数值,这些数值是造成冒泡排序缓慢的主因。相对地,兔子,亦即在阵列前端的大数值,不影响冒泡排序的效能。
在冒泡排序中,任何两个元素进行比较时,他们总是距离彼此为1。梳排序的基本思想是可以不是1。
梳排序中,开始时的间距设定为列表长度,然后每一次都会除以损耗因子(一般为1.3)。必要的时候,间距可以四舍五入,不断重复,直到间距变为1。然后间距就保持为1,并排完整个数列。最后阶段就相当于一个冒泡排序,但此时大多数乌龟已经处理掉,此时的冒泡排序就高效了。
最坏情况时间复杂度:-
最好情况时间复杂度:-
平均情况时间复杂度:-
最坏情况空间复杂度:O(1)
圈排序
圈排序是一个就地、不稳定的排序算法,根据原始的数组,一种理论上最优的比较,并且与其它就地排序算法不同。它的思想是把要排的数列分解为圈,即可以分别旋转得到排序结果。
不同于其它排序的是,元素不会被放入数组的中任意位置从而推动排序。每个值如果它已经在其正确的位置则不动,否则只需要写一次即可。也就是说仅仅最小覆盖就能完成排序。
最坏情况时间复杂度:O(n^2)
最好情况时间复杂度:-
平均情况时间复杂度:O(n^2)
最坏情况空间复杂度:O(1) 辅助空间
地精排序
地精排序(gnome sorting,大部分地方翻成“侏儒排序”,“地精排序”明明更好听呀,本文就这么用了。)最初由哈米德在2000年的时候提出,当时称为傻瓜排序,之后被迪克说明并且命名为“地精排序”。除了某个元素是经过一系列的互换(类似冒泡排序)才到了它的正确位置之外,它和插入排序挺相似。
它在概念上很简单,不需要嵌套循环。运行时间是O(n2),如果列表基本有序,则时间为O(n)。实际上,它和插入排序一样,平均运行时O(n2)。
地精算法总是发现第一个两个相邻元素存在错误的顺序,然后把他们交换。原理是,交换一对乱序元素后,会产生一对新的无序相邻元素,而这两个元素要么交换前有序,要么交换后有序。它不认为元素当前的位置是有序的,所以它只需要在交换元素前直接检查位置。
最坏情况时间复杂度:O(n^2)
最好情况时间复杂度:-
平均情况时间复杂度:-
最坏情况空间复杂度:O(1)
堆排序
堆排序是从数据集构建一个数据堆,然后提取最大元素,把它放到部分有序的数组的末尾。提取最大元素后,重新构建新堆,然后又接着提取新堆这的最大元素。重复这个过程,直到堆中没有元素并且数组已排好。堆排序的基本实现需要两个数组:一个用于构建堆,另一个是存放有序的元素。
堆排序把输入数组插入到一个二叉堆的数据结构中。最大值(大根堆)或最小值(小根堆)会被提取出来,直到堆空为止,提取出来的元素,是已经排好序的。每次提取后,堆中没变换的元素依然保留了,所以(堆排序的)唯一消耗就是提取过程。
在提取过程中,所需要的空间,就是用于存放堆的空间。为了实现恒定的空间开销,堆是存储在输入数组中还没有完成排序的那部分空间中。堆排序使用了两个堆操作:插入和根删除。每个提取的元素放到数组的最后一个空位置。数组剩余位置存放待排元素。
最坏情况时间复杂度:O(nlogn)
最好情况时间复杂度:O(nlogn)
平均情况时间复杂度:O(nlogn)
最坏情况空间复杂度:O(1)
插入排序
插入排序的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,通常采用in-place排序(即只需用到O(1)的额外空间的排序),因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。
具体算法描述如下:
-
从第一个元素开始,该元素可以认为已经被排序
-
取出下一个元素,在已经排序的元素序列中从后向前扫描
-
如果该元素(已排序)大于新元素,将该元素移到下一位置
-
重复步骤3,直到找到已排序的元素小于或者等于新元素的位置
-
将新元素插入到该位置后
-
重复步骤2~5
最坏情况时间复杂度:O(n^2)
最好情况时间复杂度:O(n)
平均情况时间复杂度:O(n^2)
最坏情况空间复杂度:O(1)
归并排序
从概念上讲,归并排序的工作原理如下:
-
如果列表的长度是0或1,那么它已经有序。否则:
-
未排序的部分平均划分为两个子序列。
-
每个子序列,递归使用归并排序。
-
合并两个子列表,使之整体有序。
归并排序包含两个主要观点,以改善其运行时:
-
一个小列表排序的花费少于大列表。
-
把两个有序表合并,要比直接排列一个无序表花费更少的步骤。例如,您只需要遍历每个有序列表一次即可(见下面的合并功能)。
归并操作的过程如下:
-
申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列
-
设定两个指针,最初位置分别为两个已经排序序列的起始位置
-
比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置
-
重复步骤3直到某一指针到达序列尾
-
将另一序列剩下的所有元素直接复制到合并序列尾
最坏情况时间复杂度:O(nlogn)
最好情况时间复杂度:O(nlogn)
平均情况时间复杂度:O(nlogn)
最坏情况空间复杂度:-
奇偶排序
奇偶排序是一个相对简单的排序算法。它是一种基于冒泡排序的比较算法,它们有着许多共同点。它通过比较所有相邻的(奇数偶)对进行排序,如果某对存在错误的顺序(第一个元素大于第二个),则交换。下一步针对{偶奇对}重复这一操作。然后序列就在(奇,偶)和(偶,奇)之间变换,直到列表有序。它可以看作是是使用并行处理器,每个都用了冒泡排序,但只是起始点在列表的不同位置(所有奇数位置可做第一步)。这个排序算法实现起来只是略微比冒泡排序复杂一些。
鸽巢排序
鸽巢排序,也被称为 count sort (不要和 counting sort 搞混了),当数组元素的元素数量(n)和可能的键值数(key value,N)大约相同时,这种排序算法实用。它的时间复杂度为O(n+N)。
(在不可避免遍历每一个元素并且排序的情况下效率最好的一种排序算法。但它只有在差值(或者可被映射在差值)很小的范围内的数值排序的情况下实用。)
算法流程如下:
-
假设有个一个待排序的数组,给它建立了一个空的辅助数组(称为“鸽巢”)。把原始数组中的每个值作为一个key(“格子”)。
-
遍历原始数组,根据每个值放入辅助数组对应的“格子”
-
顺序遍历“鸽巢”数组(辅助数组),把非空鸽巢中的元素放回原始数组。
最坏情况时间复杂度:O(n+2k)
最好情况时间复杂度:-
平均情况时间复杂度:O(n+2k)
最坏情况空间复杂度:O(2k)
快速排序
快速排序采用分而治之的策略,把一个列表划分为两个子列表。步骤是:
-
从列表中,选择一个元素,称为基准(pivot)。
-
重新排序列表,把所有数值小于枢轴的元素排到基准之前,所有数值大于基准的排基准之后(相等的值可以有较多的选择)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为**分区(partition)**操作。
-
分别递归排序较大元素的子列表和较小的元素的子列表。
递归的结束条件是列表元素为零或一个,即已不需要排序。
最坏情况时间复杂度:O(n^2)
最好情况时间复杂度:O(nlogn)
平均情况时间复杂度:O(nlogn)
最坏情况空间复杂度:O(logn)
使用冒泡的快速排序
选择排序
原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。
算法过程如下:
-
找到列表中的最小值,
-
把它和第一个位置的元素交换,
-
列表其余部分重复上面的步骤(从第二个位置开始,且每次加1)。
列表被有效地分为两个部分:从左到右的有序部分,和余下待排序部分。
最坏情况时间复杂度:O(n^2)
最好情况时间复杂度:O(n^2)
平均情况时间复杂度:O(n^2)
最坏情况空间复杂度:O(1)
希尔排序
希尔排序通过将比较的全部元素分为几个区域来提升插入排序的性能。这样可以让一个元素可以一次性地朝最终位置前进一大步。然后算法再取越来越小的步长进行排序,算法的最后一步就是普通的插入排序,但是到了这步,需排序的数据几乎是已排好的了(此时插入排序较快)。
假设有一个很小的数据在一个已按升序排好序的数组的末端。如果用复杂度为O(_n_2)的排序(冒泡排序或插入排序),可能会进行_n_次的比较和交换才能将该数据移至正确位置。而希尔排序会用较大的步长移动数据,所以小数据只需进行少数比较和交换即可到正确位置。
一个更好理解的希尔排序实现:将数组列在一个表中并对列排序(用插入排序)。重复这过程,不过每次用更长的列来进行。最后整个表就只有一列了。将数组转换至表是为了更好地理解这算法,算法本身仅仅对原数组进行排序(通过增加索引的步长,例如是用i += step_size
而不是i++
)。
例如,假设有这样一组数[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ],如果我们以步长为5开始进行排序,我们可以通过将这列表放在有5列的表中来更好地描述算法,这样他们就应该看起来是这样:
13 14 94 33 82
25 59 94 65 23
45 27 73 25 39
10
然后我们对每列进行排序:
10 14 73 25 23
13 27 94 33 39
25 59 94 65 82
45
将上述四行数字,依序接在一起时我们得到:[ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ].这时10已经移至正确位置了,然后再以3为步长进行排序:
10 14 73
25 23 13
27 94 33
39 25 59
94 65 82
45
排序之后变为:
10 14 13
25 23 33
27 25 59
39 65 73
45 94 82
94
最后以1步长进行排序(此时就是简单的插入排序了)。
最坏情况时间复杂度:-
最好情况时间复杂度:O(n-)
平均情况时间复杂度:O(nlog2n)
最坏情况空间复杂度:O(1)
除此之外,还有很多奇葩的排序算法,如:
猴子排序(Bogo-sort)、基数排序······!