《算法导论》之排序算法杂谈（一）

读书笔记第九周 PB14214061 张士龙《算法导论》之排序算法杂谈（一）

排序可谓是算法中最基本的基本问题，因为它不但可以拿出来来解决特定的排序问题，同时作为许多复杂的算法的子模块存在，在上几周中，我比较仔细的看了算法导论中中的排序部分，后面的习题中感觉有意思的也做了详细的思考，感觉很有收获。总体上还是按算法种类来写，堆排与快排看的最为仔细，写的也会多一点,比如快排的优化，如何减小快排的栈深度。而且像是快排，归并利用分治思想的算法，都十分适合进行多线程优化，我在学习过程中也进行了尝试。

基础较好的可以直接看堆排与快排部分。

关于算法的理解

先来说说我总体的一个感悟，排序的过程可以理解为不断了解序列中数之间的大小关系的过程，可以说不同的问题，其不同的实际意义赋予其不同的特性，比如排序的键值是否相同，范围如何，是离散的还是连续的，这些都会对排序产生影响。我们可以这样理解这种影响，假如是我们完全不知道有任何特性的序列，我们想要知道他们的次序要获取的信息量是一定的，具体的排序操作会为我们提供一定的信息量，问题原本的些特性也会为我们提供的一定的信息量，如何充分利用问题原本的条件提供的信息，加以合适步骤设计（平均每个操作为我们提供的信息较大），就可以认为是相对于此问题的较优的算法。 PS.很好奇有没有人利用信息论做过算法的研究。

优秀的算法设计应当是适配特定的问题的，而书本上经典的算法只能算作我们的素材，面对具体问题我们应该做出相应的改动，在下面应该会体现这一点。

插入排序

1.思路

思路是从序列的前端维护一个有序区，从无序区选择元素插入有序区，逐渐将有有序区扩大到是整个序列。其中前端有序区就是我们的后面提到的用于证明的循环不变量。

2.伪码

INSERTION-SORT(A)
for j = 2 to A.lenghth
    key = A[j]
    i = j - 1
    while i > 0 and A[i] > key
        A[i+1] = A[i]
        i = i - 1
    A[i] = key

3. 复杂度

时间复杂度

最好情况：

原本有序，只需O(n)

平均：

最差：

恰好逆序，

空间复杂度

原址排序

稳定性

稳定
这个作者放在了最前面，主要是想为读者理清行文的思路，同时讲解一些常用的技巧，如利用的循环不变式进行算法的证明：循环前不变式成立，循环中不变式成立，循环结束后不变式成立。

归并排序

1.思路

采用的是分治的思想，即将问题分解成几个原问题的子问题，然后递归的求解子问题，最后再将子问题的解合并，得到原问题的解。基本思路是不断将序列分为子序列，将子序列排好序，然后将他们合并起来。一般可以利用多线程方法优化。

2.伪码

MERGE(A,p,q,r)          //A中p到q, q+1到r为排好序的子数组
n1 = q - p + 1
n2 = r - q
for i = 1 to n1 
    L[i] = A[p+i-1]
for j = 1 to n2
    R[j] = A[q+j]
L[n1+1] = flag          //flag为一个足够大的值,充当哨兵，可以省去判空的逻辑
R[n2+1] = flag
i = j = 1
for k = p to r
    if L[i] <= R[j]
        A[k] = L[i]
        i = i + 1
    else
        A[k] = L[j]
        j = j + 1
MERGE-SORT(A,P,r)
    if(p < r)
        q = floor((p + r) / 2)
        MERGE-SORT(A,p,q)
        MERGE-SORT(A,q+1,r)
        MERGE(A,p,q,r)

3. 复杂度

时间复杂度

时间复杂度我们很容易由递推式

平均O

最差

空间复杂度

这部分分析还是加入了我许多思考的，我们应该如何理解这个空间复杂度呢，递归算法其实占用的空间可以理解为两部分，一个是程序中开辟的空间，另一部分是递归函数压栈占据的空间（这也是快排空间复杂度最主要的部分），算法每次归并需要开辟新数组，其实底层的归并是占用不了多少空间的，因为递归较深的时候，需要归并的数组比较小，而我们讲的空间复杂复杂度应该是算法运行时间中占据的最大空间

ps.此处讲道理应该是算严格计算压栈空间与开的临时数组的最大值的，但是我相信大家能看出来，很明显是递归结束时候总空间最大，虽然此时只有开辟的数组，你可以这样想，栈深度越深，开辟的数组大小下降速度是指数级别的。

堆排序

1.思路

这个原理一下还真说不清楚，但是下面的伪码应该不难看懂，当然前提是你对堆的性质确实比较熟悉，no bb ,show the code

2.伪码

MAX-HEAPIFY(A,i)        //此函数作用是如果i的子孙节点满足堆性质，但是i本身不满足，通过调整i与其子孙的位置使其以i为根的树变成最大堆
l = left(i) //left与right直接定义为宏就行#define left = 2 * i 
r = right
if l <= A.heap-size and A[l] > A[i]
    largest = l
else largest = i
if r <= A.heap-size and A[r] > A[i]
    largest = r
if largest != i
    exchange A[i] with A[largest]
    MAX-HEAPIFY(A,largest) //调整largest为根的堆  
 
MAX-HEAPIFY(A,i)//非递归版本，减少压栈的时间开销
largest = i
while(i == largest )
    l = left(i) 
    r = right
    if l <= A.heap-size and A[l] > A[i]
        largest = l
    else largest = i
    if r <= A.heap-size and A[r] > A[i]
        largest = r
    if largest != i
        exchange A[i] with A[largest] 
        i = largest       //保证进入下一循环吗，调整以largest
    else largest = i + 1  //跳出循环

BUILD-MAX-HEAP(A)         //建立一个最大堆    
    A.heap-size = A.length
    for i = floor(A.lenghth/2) down to 1 //从最大的有孩子节点向上调整
    MAX-HEAPIFY(A,i)
HEAP-SORT(A)

BUILD-MAX-HEAP(A)
for i = A.length down to 2 
    exchange A[i] with A[1]  //将堆顶点与最后的叶子节点进行置换
    A.heap-size = A.heap-size - 1   //调节堆的大小
    MAX-HEAPIFY(A,1)                //因为置换打破了最小堆的性质。重新从顶点开始调整

3. 复杂度

时间复杂度

最好情况

平均：

最差

空间复杂度

原址排序

我看有人对于为何是

分母是假设右子树也为满的（即原树为高为h的完全二叉树）,然后再减去最后一层的一半，在高h趋于无穷时候，极限为2/3

堆排小结

堆的非常好的性质就是，建堆之后，很多操作都可以在log(n)的复杂度进行，最经典的应用莫过于在一个大量级（假设为n）的数据中找出键值最大的k个，这时候最好的办法就是维护一个最小堆，每次碰到比堆中最小的要大的，当前元素换掉顶点，调用MAX-HEAPIFY（A，1）进行调整，问题复杂度为