排序分类和内部排序之插入排序

【说明】博客内容选自课件内容

目录

一、什么是排序?

二、排序方法的稳定性能

三、内部排序和外部排序

四.  内部排序方法分类

一. 直接插入排序(基于顺序查找)“在R[1..i-1]中查找R[i]的插入位置”

内部排序的时间分析:

二. 折半插入排序(基于折半查找)

三.  2路插入排序(基于折半查找)没怎么看懂???

(个人想法)

四. 表插入排序(基于链表存储)    

五. 希尔排序(基于逐趟缩小增量)


一、什么是排序?

排序是计算机内经常进行的一种操作,其目的是将一组“无序”的记录序列调整为“有序”的记录序列。

 一般情况下,假设含n个记录的序列为{ R1, R2, Rn }其相应的关键字序列为  { K1, K2, Kn }

这些关键字相互之间可以进行比较,即在它们之间存在着这样一个关系Kp1Kp2Kpn

按此固有关系将上式记录序列重新排列为  { Rp1, Rp2, Rpn }

操作称作排序

二、排序方法的稳定性能

稳定的排序方法指的是,对于两个关键字相等的记录,它们在序列中的相对位置,在排序之前和经过排序之后,没有改变。

排序之前 :   { · · · · · Ri(K) · · · · · Rj(K) · · · · · }

排序之后 :   { · · · · · Ri(K) Rj(K) · · · · ·· · · · · }

如果排序之后 :  { · · · · · Rj(K) Ri(K) · · · · ·· · · · · }则不稳定!

三、内部排序和外部排序

整个排序过程不需要访问外存便能完成,则称此类排序问题内部排序 

反之,若参加排序的记录数量很大,整个序列的排序过程不可能在内存中完成,则称此类排序问题外部排序

内部排序方法分类

按照排序过程所需要的工作量来分类:     

简单排序:On2

高级排序:On×logn

基数排序:Od ×n

基于不同的“扩大 有序序列长度的方法,内部排序大致可分下列几种类型:

插入类  交换类  选择类   归并类  其它方法

1. 插入类:将无序子序列中的一个或几个记录插入到有序序列中,从而增加记录的有序子序列的长度。

2. 选择类:从记录的无序子序列中“选择”关键字最小或最大的记录,并将它加入到有序子序列中,从而增加记录的有序子序列的长度。

3. 交换类:通过“交换”无序序列中的记录从而得到其中关键字最小或最大记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。

4. 归并类:通过“归并”两个或两个以上的记录有序子序列,逐步增加记录有序序列的长度。

插 入 排 序

一趟插入排序的基本思想:

实现“一趟插入排序”可分三步进行:

(1)R[1..i-1]查找R[i]的插入位置;R[1..j].key <= R[i].key < R[j+1..i-1].key

(2)R[j+1..i-1]中的所有记录均后移一个位置;

(3)R[i] 插入(复制)R[j+1]的位置上。

各种插入算法:

. 直接插入排序(基于顺序查找)“在R[1..i-1]查找R[i]的插入位置”

算法的实现要点:分四个步骤执行

1.R[i-1]起向前进行顺序查找,              

2.对于在查找过程中找到的那些关键字不小于R[i].key的记录,在查找的同时实现记录向后移动;

3. 上述循环结束后可以直接进行“插入”

4.  i = 23…, n,实现整个序列的排序。

void InsertionSort ( SqList &L ) {
  // 对顺序表 L 作直接插入排序。
   for ( i=1+1; i<=L.length; i=i+1 ) 
    L.r[0] = L.r[i];            // 复制为监视哨兵
    for ( j=i-1; L.r[0].key < L.r[j].key;  j=j-1 )
        L.r[j+1] = L.r[j];        // 记录后移
    L.r[j+1] = L.r[0];        // 插入到正确位置
} // InsertSort

内部排序的时间分析

实现内部排序的基本操作有两个:

1“比较”序列中两个关键字的 大小;(2“移动”记录。

最坏的情况下比较次数依次为n, n-1, ..., 2

二. 折半插入排序(基于折半查找)

因为 R[1..i-1] 是一个按关键字有序

的有序序列,则可以利用折半查找实现“在R[1..i-1]查找R[i]插入位置,

如此实现的插入排序为折半插入排序.

平均比较次数: nlog2n

平均比较次数: nlog2n 平均移动次数: n2/4  时间复杂度: On2

.  2路插入排序(基于折半查找)没怎么看懂???

在折半的基础上再改进,目的是减少排序过程中移动记录的次数,但需要增加包含n个记录的辅助空间。

1). 设一个与待排序表L.r同类型的数组d

2). d[1]=L.r[1],将d[1]看成已经排好序的序列的中间位置;

3). L.r中的第2个位置起,将记录依次与d[1]进行比较,比d[1]大则插入d[1]之前的序列中,否则插入d[1]之后;

4). 将数组d看成一个双向循环表,设两个动态指针,first指向d[1]之前最小的记录,final指向d[1]之后最大的记录。

5). 依次处理L.r中的所有记录。

(个人想法)

感觉这个二路插入比折半插入优化的地方在于当待插入元素在和d[1]比较完之后,他不需要和之前的所有有序序列中进行折半查找,而只需要根据比较的结果比如大于或者小于只在final所指的元素左侧和first所指的元素右侧进行就好了,所以他的平均移动次数是折半插入移动次数的一半!!!

移动次数约为:   n^2/8  当L.r[1]是最小或最大时失去优越性  时间复杂度:O(n2)

. 表插入排序(基于链表存储)    

     为了减少在排序过程中的“移动” 操作,必须改变排序过程中采用的存储结构。利用静态链表进行排序,并在排序完成之后,一次性地调整各个记录相互之间的位置,即将每个记录都调整到它们所应该在的位置上。

两个问题:1. 如何在静态链表上排序?         2. 如何在排序之后调整记录序列?

移动次数:0    比较次数与直接插入相同。    平均比较次数:On2    时间复杂度:On2

3. 如何在排序之后调整记录序列?

调整的原则是:排序后链表中的第 i 个结点应该是排序后数组中的第 i 个分量;

设排序后第 i 个最小关键字的结点在数组中的下标为 p

如果 p> i,则先保持SL.r[p]的指针到 q ( qp的下一个结点),然后互换SL.r[i]SL.r[p],且令SL.r[i]的指针域指向p

如果p< i,则应顺链表继续查找到p≥i为止。

. 希尔排序(基于逐趟缩小增量)

基本思想:对待排记录序列先作“宏观”调整,再作“微观”调整。

所谓“宏观”调整,指的是,“跳跃式”的插入排序。具体做法为:

将记录序列分成若干子序列,分别对每个子序列进行插入排序。

例如:将 n 个记录分成 d 个子序列:

  { R[1]R[1+d]R[1+2d]R[1+kd] }

  { R[2]R[2+d]R[2+2d]R[2+kd] }

    …

  { R[d]R[2d]R[3d]R[kd]R[(k+1)d] }

其中,d 称为增量,它的值在排序过程中从大到小逐渐缩小,直至最后一趟排序减为 1

猜你喜欢

转载自blog.csdn.net/liuxiang15/article/details/82758788
今日推荐