【说明】博客内容选自课件内容

一、什么是排序？

二、排序方法的稳定性能

三、内部排序和外部排序

四. 内部排序方法分类

一. 直接插入排序（基于顺序查找）“在R[1..i-1]中查找R[i]的插入位置”

内部排序的时间分析：

二. 折半插入排序（基于折半查找）

三. 2路插入排序（基于折半查找）没怎么看懂？？？

（个人想法）

四. 表插入排序（基于链表存储）

五. 希尔排序（基于逐趟缩小增量）

一、什么是排序？

排序是计算机内经常进行的一种操作，其目的是将一组“无序”的记录序列调整为“有序”的记录序列。

一般情况下，假设含n个记录的序列为{ R1, R2, …， Rn }其相应的关键字序列为 { K1, K2, …，Kn }

这些关键字相互之间可以进行比较，即在它们之间存在着这样一个关系Kp1≤Kp2≤…≤Kpn

按此固有关系将上式记录序列重新排列为 { Rp1, Rp2, …，Rpn }

的操作称作排序。

二、排序方法的稳定性能

稳定的排序方法指的是，对于两个关键字相等的记录，它们在序列中的相对位置，在排序之前和经过排序之后，没有改变。

排序之前 : { · · · · · Ri(K) · · · · · Rj(K) · · · · · }

排序之后 : { · · · · · Ri(K) Rj(K) · · · · ·· · · · · }

如果排序之后 : { · · · · · Rj(K) Ri(K) · · · · ·· · · · · }则不稳定！

三、内部排序和外部排序

若整个排序过程不需要访问外存便能完成，则称此类排序问题为内部排序；

反之，若参加排序的记录数量很大，整个序列的排序过程不可能在内存中完成，则称此类排序问题为外部排序

四. 内部排序方法分类

按照排序过程所需要的工作量来分类：　　　

简单排序：O（n2）

高级排序：O（n×logn）

基数排序：O（d ×n）

基于不同的“扩大” 有序序列长度的方法,内部排序大致可分下列几种类型：

插入类交换类选择类归并类其它方法

1. 插入类：将无序子序列中的一个或几个记录“插入”到有序序列中，从而增加记录的有序子序列的长度。

2. 选择类：从记录的无序子序列中“选择”关键字最小或最大的记录，并将它加入到有序子序列中，从而增加记录的有序子序列的长度。

3. 交换类：通过“交换”无序序列中的记录从而得到其中关键字最小或最大的记录，并将它加入到有序子序列中，以此方法增加记录的有序子序列的长度。

4. 归并类：通过“归并”两个或两个以上的记录有序子序列，逐步增加记录有序序列的长度。

插入排序

一趟插入排序的基本思想：

实现“一趟插入排序”可分三步进行：

(1)．在R[1..i-1]中查找R[i]的插入位置；R[1..j].key <= R[i].key < R[j+1..i-1].key

(2)．将R[j+1..i-1]中的所有记录均后移一个位置；

(3)．将R[i] 插入(复制)到R[j+1]的位置上。

各种插入算法：

一. 直接插入排序（基于顺序查找）“在R[1..i-1]中查找R[i]的插入位置”

算法的实现要点：分四个步骤执行

1.从R[i-1]起向前进行顺序查找，

2.对于在查找过程中找到的那些关键字不小于R[i].key的记录，在查找的同时实现记录向后移动；

3. 上述循环结束后可以直接进行“插入”

4. 令 i = 2，3，…, n,实现整个序列的排序。

void InsertionSort ( SqList &L ) {
  // 对顺序表 L 作直接插入排序。
   for ( i=1+1; i<=L.length; i=i+1 ) 
    L.r[0] = L.r[i];            // 复制为监视哨兵
    for ( j=i-1; L.r[0].key < L.r[j].key;  j=j-1 )
        L.r[j+1] = L.r[j];        // 记录后移
    L.r[j+1] = L.r[0];        // 插入到正确位置
} // InsertSort

内部排序的时间分析：

实现内部排序的基本操作有两个：

（1）“比较”序列中两个关键字的大小；（2）“移动”记录。

最坏的情况下比较次数依次为n, n-1, ..., 2

二. 折半插入排序（基于折半查找）

因为 R[1..i-1] 是一个按关键字有序

的有序序列，则可以利用折半查找实现“在R[1..i-1]中查找R[i]的插入位置”,

如此实现的插入排序为折半插入排序.

平均比较次数: nlog2n

平均比较次数: nlog2n 平均移动次数: n2/4 时间复杂度： O（n2）

三. 2路插入排序（基于折半查找）没怎么看懂？？？

在折半的基础上再改进，目的是减少排序过程中移动记录的次数，但需要增加包含n个记录的辅助空间。

1). 设一个与待排序表L.r同类型的数组d；

2). 令d[1]=L.r[1]，将d[1]看成已经排好序的序列的中间位置；

3). 从L.r中的第2个位置起，将记录依次与d[1]进行比较，比d[1]大则插入d[1]之前的序列中,否则插入d[1]之后；

4). 将数组d看成一个双向循环表，设两个动态指针，first指向d[1]之前最小的记录，final指向d[1]之后最大的记录。

5). 依次处理L.r中的所有记录。

（个人想法）

感觉这个二路插入比折半插入优化的地方在于当待插入元素在和d[1]比较完之后，他不需要和之前的所有有序序列中进行折半查找，而只需要根据比较的结果比如大于或者小于只在final所指的元素左侧和first所指的元素右侧进行就好了，所以他的平均移动次数是折半插入移动次数的一半！！！

移动次数约为: n^2/8 当L.r[1]是最小或最大时失去优越性时间复杂度：O（n2）

四. 表插入排序（基于链表存储）

为了减少在排序过程中的“移动” 操作，必须改变排序过程中采用的存储结构。利用静态链表进行排序，并在排序完成之后，一次性地调整各个记录相互之间的位置，即将每个记录都调整到它们所应该在的位置上。

两个问题：1. 如何在静态链表上排序？ 2. 如何在排序之后调整记录序列？

移动次数：0 比较次数与直接插入相同。 平均比较次数：O（n2） 时间复杂度：O（n2）

3. 如何在排序之后调整记录序列？

调整的原则是：排序后链表中的第 i 个结点应该是排序后数组中的第 i 个分量；

设排序后第 i 个最小关键字的结点在数组中的下标为 p，

如果 p> i，则先保持SL.r[p]的指针到 q ( q为p的下一个结点）,然后互换SL.r[i]和SL.r[p]，且令SL.r[i]的指针域指向p。

如果p< i，则应顺链表继续查找到p≥i为止。

五. 希尔排序（基于逐趟缩小增量）

基本思想：对待排记录序列先作“宏观”调整，再作“微观”调整。

所谓“宏观”调整，指的是，“跳跃式”的插入排序。具体做法为：

将记录序列分成若干子序列，分别对每个子序列进行插入排序。

例如：将 n 个记录分成 d 个子序列：

{ R[1]，R[1+d]，R[1+2d]，…，R[1+kd] }

{ R[2]，R[2+d]，R[2+2d]，…，R[2+kd] }

…

{ R[d]，R[2d]，R[3d]，…，R[kd]，R[(k+1)d] }

其中，d 称为增量，它的值在排序过程中从大到小逐渐缩小，直至最后一趟排序减为 1。

排序分类和内部排序之插入排序

一、什么是排序？

二、排序方法的稳定性能

三、内部排序和外部排序

四. 内部排序方法分类

一. 直接插入排序（基于顺序查找）“在R[1..i-1]中查找R[i]的插入位置”

内部排序的时间分析：

二. 折半插入排序（基于折半查找）

三. 2路插入排序（基于折半查找）没怎么看懂？？？

（个人想法）

四. 表插入排序（基于链表存储）

五. 希尔排序（基于逐趟缩小增量）

猜你喜欢