排序
排序的概念
排序:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。
稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。
内部排序:数据元素全部放在内存中的排序。
外部排序:数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。
常见的排序算法
一、插入排序
1.直接插入排序
概念
算法思想:把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。
图解
算法1
边比较边交换
void InsertSort_swap(int *ar, int left, int right){
int i;
for (i = left + 1; i < right; ++i)
{
int end = i;
while (end > left && ar[end] < ar[end - 1])
{
swap(&ar[end], &ar[end - 1]);
end--;
}
}
}
算法2
只比较不交换,最后找到插入位置,一次性将一段数据后移
void InsertSort_NoSwap(int *ar, int left, int right){
int i;
for (i = left + 1; i < right; ++i)
{
int temp = ar[i];
int end = i;
while (end > left && temp < ar[end - 1])
{
ar[end] = ar[end - 1];
end--;
}
ar[end] = temp;
}
}
算法3
比较的同时将大于待插入元素的值后移一位
void InsertSort_Move(int *ar, int left, int right){
int i, j;
int k;
for (j = left + 1; j < right; j++)
{
int temp = ar[j];
for (i = left; i < j; i++)
{
if (temp < ar[i])
{
for (k = j; k > i; k--)
{
ar[k] = ar[k - 1];
}
ar[i] = temp;
break;
}
else
{
continue;
}
}
}
}
2.二分插入排序
概念
算法思想:是在插入第 i 个元素时,对前面的0~i-1元素进行折半,先跟他们中间的那个元素比,如果小,则对前半再进行折半,否则对后半进行折半,直到left<right,然后再把第i个元素前1位与目标位置之间的所有元素后移,再把第i个元素放在目标位置上。
图解
算法
void BinaryInsertSort(int *ar, int left, int right){
int i;
for (i = left + 1; i < right; i++)
{
int low = left;
int high = i - 1;
int mid;
int temp = ar[i];
while (low <= high)
{
mid = (low + high) / 2;
if (ar[mid] < ar[i])
low = mid + 1;
else
high = mid - 1;
}
int j;
for (j = i; j > mid; j--)
{
ar[j] = ar[j - 1];
}
ar[mid] = temp;
}
}
3.两路插入排序
概念
算法思想:构建一同样大小的循环数组b,把原数组的元素依次插入,最后按合适次序赋值回原数组。
图解
算法
void TwoWayInsertSort(int *ar, int left, int right){
int n = right - left;
int *a = (int*)malloc(sizeof(int)* n);
int first = 0, final = 0;
a[0] = ar[0];
int i;
for (i = left + 1; i < n; i++)
{
if (ar[i] >= a[0])
{
//后插
int j = 0;
while (j <= final && ar[i] > a[j])
j++;
if (j <= final)
{
int k;
for (k = final + 1; k > j; k--)
a[k] = a[k - 1];
}
a[j] = ar[i];
final++;
}
else
{
//前插
if (first == 0)
{
first = n - 1;
a[first] = ar[i];
}
else
{
int j = n - 1;
while (j >= first && ar[i] < a[j])
j--;
if (j >= first){
int k;
for (k = first - 1; k < j; k++)
a[k] = a[k + 1];
}
a[j] = ar[i];
first--;
}
}
}
//将排序好的数据 复制 回原数组中
if (first == 0){
int z;
for (z = 0; z < n; z++)
ar[z] = a[z];
}
else
{
int index = first;
i = 0;
while (index <= n - 1)
{
ar[i] = a[index];
index++;
i++;
}
index = 0;
while (index <= final)
{
ar[i] = a[index];
index++;
i++;
}
}
}
4.希尔排序
概念
希尔排序法又称缩小增量法,是插入排序的一种更高效的改进版本。但希尔排序是非稳定排序算法。
算法思想:
- 希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;
- 随着增量逐渐减少,每组包含的关键词越来越多,当增量减至 1 时,整个文件恰被分成一组,算法便终止。
算法步骤:
- 选择一个增量序列 t1,t2,……,tk,其中 ti > tj, tk = 1;
- 按增量序列个数 k,对序列进行 k 趟排序;
- 每趟排序,根据对应的增量 ti,将待排序列分割成若干长度为 m 的子序列,分别对各子表进行直接插入排序。仅增量因子为 1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。
图解
下面以数列{80,30,60,40,20,10,50,70}为例,演示它的希尔排序过程。
第一趟:(gap=4)
当gap=4时,意味着将数列分为4个组: {80,20},{30,10},{60,50},{40,70}。 对应数列: {80,30,60,40,20,10,50,70}
对这4个组分别进行排序,排序结果: {20,80},{10,30},{50,60},{40,70}。 对应数列: {20,10,50,40,80,30,60,70}
第二趟:(gap=2)
当gap=2时,意味着将数列分为2个组:{20,50,80,60}, {10,40,30,70}。 对应数列: {20,10,50,40,80,30,60,70}
对这2个组分别进行排序,排序结果:{20,50,60,80}, {10,30,40,70}。 对应数列: {20,10,50,30,60,40,80,70}
注意:{20,50,80,60}实际上有两个有序的数列{20,80}和{50,60}组成。{10,40,30,70}实际上有两个有序的数列{10,30}和{40,70}组成。
第三趟:(gap = 1)
当gap=1时,意味着将数列分为1个组:{20,10,50,30,60,40,80,70}
对这1个组分别进行排序,排序结果:{10,20,30,40,50,60,70,80}
注意:{20,10,50,30,60,40,80,70}实际上有两个有序的数列{20,50,60,80}和{10,30,40,70}组成。
算法1
void ShellSort(int *ar, int left, int right){
int dk = right - left;
while (dk > 1)
{
dk = dk / 3 + 1; //这里不一定是3,开发中会给出设置增量的方式
int i;
for (i = left + dk; i < right; ++i)
{
if (ar[i] < ar[i - dk])
{
int tmp = ar[i];
int end = i - dk;
while (end >= left && tmp < ar[end]) //将数据交换到最适合的位置
{
ar[end + dk] = ar[end];
end -= dk;
}
ar[end + dk] = tmp;
}
}
}
}
算法2
int dlta[] = {
5, 3, 2, 1 };
void ShellInsert(int *ar, int left, int right, int dk)
{
for (int i = left + dk; i < right; ++i)
{
if (ar[i] < ar[i - dk])
{
int tmp = ar[i];
int end = i - dk;
while (end >= left && tmp < ar[end])
{
ar[end + dk] = ar[end];
end -= dk;
}
ar[end + dk] = tmp;
}
}
}
void ShellSort(int *ar, int left, int right)
{
int t = sizeof(dlta) / sizeof(dlta[0]);
for (int k = 0; k < t; ++k)
ShellInsert(ar, left, right, dlta[k]);
}
算法3
int dlta[] = {
5, 3, 2, 1 };
void ShellInsert(int *ar, int n, int dk){
int i, j;
for (i = dk; i < n; i++)
{
if (ar[i] < ar[i - dk])
{
int tmp = ar[i];
for (j = i - dk; j >= 0 && tmp < ar[j]; j -= dk)
ar[j + dk] = ar[j];
ar[j + dk] = tmp;
}
}
}
void ShellSort(int *ar, int n, int dlta[], int dltaSize){
int k;
for (k = 0; k < dltaSize; k++)
ShellInsert(ar, n, dlta[k]);
}
二、选择排序
1.选择排序
概念
算法思想:每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完 。
算法步骤:
- 首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置
- 再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。
- 重复第二步,直到所有元素均排序完毕。
图解
算法
int GetMinIndex(int *ar, int left, int right){
int min = ar[left];
int index = left;
for (int i = left + 1; i < right; i++)
{
if (ar[i] < min){
min = ar[i];
index = i;
}
}
return index;
}
void SelectSort(int *ar, int left, int right){
for (int i = left; i < right; i++)
{
int index = GetMinIndex(ar, i, right);
if (index != i)
swap(&ar[index], &ar[i]);
}
}
2.堆排序
概念
堆排序(Heapsort)是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构,并同时满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。堆排序可以说是一种利用堆的概念来排序的选择排序。分为两种方法:
- 大顶堆:每个节点的值都大于或等于其子节点的值,在堆排序算法中用于升序排列;
- 小顶堆:每个节点的值都小于或等于其子节点的值,在堆排序算法中用于降序排列;
堆排序的平均时间复杂度为 Ο(nlogn)。
算法步骤:
- 将待排序序列构建成一个堆 H[0……n-1],根据(升序降序需求)选择大顶堆或小顶堆;
- 把堆首(最大值)和堆尾互换;
- 把堆的尺寸缩小 1,并调用 shift_down(0),目的是把新的数组顶端数据调整到相应位置;
- 重复步骤 2,直到堆的尺寸为 1。
图解
算法
void ShiftDown(int *ar, int left,int right, int curpos){
int n = right - left;
int j = curpos;
int i = ar[2 * j + 1] > ar[2 * j + 2] ? (2 * j + 1) : (2 * j + 2);
while (j < n){
if (i<n && ar[j] < ar[i]){
swap(&ar[j], &ar[i]);
j = i;
i = ar[2 * j + 1] > ar[2 * j + 2] ? (2 * j + 1) : (2 * j + 2);
}
else{
break;
}
}
}
void HeapSort(int *ar, int left, int right){
//创建堆
int n = right - left;
int cur = n / 2 - 1 + left;
while (cur > 0)
{
ShiftDown(ar, left,right, cur);
cur--;
}
//排序
int end = right - 1;
while (end > left)
{
swap(&ar[end], &ar[left]);
end--;
ShiftDown(ar, left, end, left);
}
}
三、交换排序
1.冒泡排序
概念
冒泡排序(Bubble Sort)也是一种简单直观的排序算法。
它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。
走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。
这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。
算法步骤:
- 比较相邻的元素。如果第一个比第二个大,就交换他们两个。
- 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。
- 针对所有的元素重复以上的步骤,除了最后一个。
- 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。
图解
算法1
void BubbleSort(int *ar, int left, int right){
int i = 0;
int j;
for (; i<right - left; i++){
for (j = i + 1; j<right - left; j++){
if (ar[i] > ar[j]){
swap(&ar[i], &ar[j]);
}
}
}
}
算法2
void BubbleSort(int *ar, int left, int right)
{
int n = right - left;
for (int i = left; i<n - 1; ++i)
{
for (int j = left; j<n - i - 1; ++j)
{
if (ar[j] > ar[j + 1])
{
swap(&ar[j], &ar[j + 1]);
}
}
}
}
算法3
void BubbleSort(int *ar, int left, int right)
{
int n = right - left;
bool is_swap = false;
for (int i = left; i<n - 1; ++i)
{
for (int j = left; j<n - i - 1; ++j)
{
if (ar[j] > ar[j + 1])
{
swap(&ar[j], &ar[j + 1]);
is_swap = true;
}
}
if (!is_swap)
break;
else
is_swap = false;
}
}
2.快速排序
概念
- 快速排序是由东尼·霍尔所发展的一种排序算法。
- 在平均状况下,排序 n 个项目要 Ο(nlogn) 次比较。
- 在最坏状况下则需要 Ο(n^2) 次比较,但这种状况并不常见。
- 事实上,快速排序通常明显比其他 Ο(nlogn) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来。
- 快速排序,顾名思义:排序速度快,效率高,处理大数据量速度最快的算法之一。
- 虽然最坏情况时间复杂度 Ο(n^2) ,但是在大多数情况下都比平均时间复杂度 Ο(nlogn)快。
原因:快速排序的最坏运行情况是 O(n²),比如说顺序数列的快排。但它的平摊期望时间是 O(nlogn),且 O(nlogn) 记号中隐含的常数因子很小,比复杂度稳定等于 O(nlogn) 的归并排序要小很多。所以,对绝大多数顺序性较弱的随机数列而言,快速排序总是优于归并排序。
算法步骤:
- 从数列中挑出一个元素,称为 “基准”(pivot);
- 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;
- 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序;
图解
算法
int Partition_H(int* ar, int left, int right){
int key = ar[left];
while (left < right)
{
while (left<right && ar[right] >= key)
right--;
swap(&ar[left], &ar[right]);
while (left<right && ar[left] <= key)
left++;
swap(&ar[left], &ar[right]);
}
return left;
}
void QuickSort_Hoare(int *ar, int left, int right){
/*
右边大于左边 --
右边小于左边 交换
左边小于右边 --
左边大于右边 交换
*/
if (left >= right) return;
int pos = Partition_H(ar, left, right - 1); //分割,左边小于关键值,右边大于关键值
QuickSort_Hoare(ar, left, pos);
QuickSort_Hoare(ar, pos + 1, right);
}
四、归并排序
概念
归并排序(Merge sort)是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。
作为一种典型的分而治之思想的算法应用,归并排序的实现由两种方法:
- 自上而下的递归;
- 自下而上的迭代;
时间复杂度 O(nlogn)
需要额外的空间开销
算法步骤:
- 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列;
- 设定两个指针,最初位置分别为两个已经排序序列的起始位置;
- 比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置;
- 重复步骤 3 直到某一指针达到序列尾;
- 将另一序列剩下的所有元素直接复制到合并序列尾。
图解
算法
void _MergeSort(int *ar, int left, int right, int *tmp){
//1.先分解:一半一半分解,最终成一个一个的数据
if (left >= right)
return;
int mid = (left + right) / 2;
_MergeSort(ar, left, mid, tmp);
_MergeSort(ar, mid + 1, right, tmp);
//2.后排序:将原来数据排序好归并到新空间中
int begin1 = left, end1 = mid;
int begin2 = mid + 1, end2 = right;
int i = 0;
//比较两部分 按顺序放入新空间
while (begin1 <= end1 && begin2 <= end2)
{
if (ar[begin1] < ar[begin2])
{
tmp[i] = ar[begin1];
i++, begin1++;
}
else
{
tmp[i] = ar[begin2];
i++, begin2++;
}
}
//将没放完的那一半 全部放入
while (begin1 <= end1)
{
tmp[i] = ar[begin1];
i++, begin1++;
}
while (begin2 <= end2)
{
tmp[i] = ar[begin2];
i++, begin2++;
}
memcpy(ar + left, tmp, sizeof(int)*(right - left + 1));
}
void MergeSort(int *ar, int left, int right){
int n = right - left;
int *tmp = (int*)malloc(sizeof(int)* n);
assert(tmp != NULL);
//归并排序的过程
_MergeSort(ar, left, right - 1, tmp);
free(tmp);
tmp = NULL;
}
五、基数排序
概念
- 基数排序是一种非比较型整数排序算法
- 其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。
- 由于整数也可以表达字符串(比如名字或日期)和特定格式的浮点数,所以基数排序不局限使用于整数。
图解
算法
#define K 2
#define RADIX_VAL 10
List list[RADIX_VAL];
int GetKey(int value, int k){
int key;
while (k >= 0)
{
key = value % 10;
value /= 10;
k--;
}
return key;
}
void Distribute(int* ar, int left, int right, int k){
int i;
for (i = left; i < right; i++){
int key = GetKey(ar[i], k);
AddFromTail(&list[key], ar[i]);
}
}
void Collect(int* ar){
int k = 0, i = 0;
for (; i<RADIX_VAL; i++)
{
while (!IsEmpty(&list[i]))
{
ar[k] = GetHead(&list[i])->data;
k++;
DropTail(&list[i]);
}
}
}
void RadixSort(int *ar, int left, int right){
//初始化链表数组
int i;
for (i = 0; i<RADIX_VAL; i++)
Initial(&list[i]);
for (i = 0; i<K; i++)
{
//分发
Distribute(ar, left, right, i);
//收回
Collect(ar);
}
}
排序算法的复杂度及稳定性分析
名词解释
-
n:数据规模
-
k:“桶”的个数
-
In-place:占用常数内存,不占用额外内存
-
Out-place:占用额外内存
关于时间复杂度
- 平方阶 (O(n^2)) 排序 各类简单排序:直接插入、直接选择和冒泡排序。
- 线性对数阶 (O(nlogn)) 排序 快速排序、堆排序、归并排序、希尔排序
- 线性阶 (O(n)) 排序 基数排序,此外还有桶、箱排序。
关于稳定性
-
稳定性:排序后 2 个相等键值的顺序和排序之前它们的顺序相同
-
稳定的排序算法:冒泡排序、插入排序、归并排序和基数排序。
-
不是稳定的排序算法:选择排序、快速排序、希尔排序、堆排序。