经典排序算法及其Python实现

写在前面

前面学习了几种典型的数据结构，当然数据结构和算法是密不可分的，算法作为程序的一个重要部分也是在求职面试中屡问不爽的考点，最近我们就来整理一下一些经典的算法，包括排序、查找、图、动态规划等等。这一篇就从最常见的排序算法开始。

1.排序及其分类

所谓排序就是将一组无序的记录序列调整为有序的记录序列。

选择排序：主要包括简单选择排序和堆排序
插入排序：简单插入排序、希尔排序
交换排序：冒泡排序、快速排序
归并排序
非比较排序：计数排序、桶排序、基数排序属于非比较排序，算法时间复杂度O(n)，属于空间换时间。

2. 经典排序的python实现

2.1 选择排序

从待排序的数据元素中选出最小的一个元素，存放在序列的起始位置，直到全部带排序的数据元素排完。

def select_sort(lists):
    n = len(list)
    for i in range(n):
        for j in range(i,n):
            if list[i]<list[j]:
                list[i],list[j]=list[j],list[i]
    return lists

2.2 插入排序

插入排序的基本操作就是将一个数据插入到已经排好序的有序数据中，从而得到一个新的、个数加一的有序数据。算法适用于少量数据的排序，时间复杂度为O(n^2)。

插入算法把要排序的数组分成两部分：第一部分包含了这个数组的所有元素，但将最后一个元素除外（让数组多一个空间才有插入的位置），而第二部分就只包含这一个元素（即待插入元素）。在第一部分排序完成后，再将这个最后元素插入到已排好序的第一部分中。步骤如下：

1 假设序列的第一个数是排序好的，（如果序列长度为1，那就更好了，不用排序了）。

2 取出已排序的数的下一个数，当前这个数是需要排序的（未排序）。用当前这个数与之前排序好的数进行比较，比较的顺序是从后往前。

3 如果当前已经排序的数比未排序的数大，则已经排序的数往后挪一个位置，空出当前已经排序位置，下次比较的已经排序好的数是当前已经排序好的数的前一个数。

4 重复步骤3，直到未排序的数小于已排序的数，将未排序的数插入到空出的位置。

5 重复2-5 ，直到所有数都排序好

def insert_sort(lists):
    size = len(lists)
    for i in range(1, size):
        key = lists[i]
        j = i-1
        while j >= 0:
            if lists[j] > key:
                lists[j+1] = lists[j]
                lists[j] = key
            j -= 1
    return lists

2.3 希尔排序

希尔排序是插入排序的一种。克服了插入排序每次只比较相邻元素的缺陷。

基本思想：

把记录按下标的一定增量进行分组，对每组直接使用插入排序算法排序；随着增量逐渐减少，每组包含的关键词越来越多，当增量减至1时，整个文件恰被分成一组，算法便终止。

def shell_sort(lists):
	n =len(lists)
	dist = n // 2
	while dist>0:
		for i in range(dist,n):
			temp = lists[i]
			j = i
			while j >= dist and temp < lists[j-dist]:
				lists[j] = lists[j-dist]
				j -= dist
			lists[j] = temp
		dist //= 2
	return lists

2.4 冒泡排序

重复地走访过要排序的数列，一次比较两个元素，如果他们的顺序错误就把他们交换过来。

走访数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。

时间复杂度为O(n^2)

def bubble_sort(lists):
    n = len(lists)
    for i in range(n):
        for j in range(1, n-i):  # 每一次冒泡将最大的数交换到数列的最后一位
            if lists[j-1] > lists[j]:
                lists[j - 1],lists[j] = lists[j], lists[j-1]
    return lists

2.5 归并排序

基本思想：

将数组A[0...n-1]中的元素分成两个子数组，A1[0...n/2] 和A2[n/2+1...n-1]。分别对这两个子数组单独排序（递归），然后将已排序的两个子数组归并成一个含有n个元素的有序数组。

合并的过程：

比较a[i]和a[j]的大小，若a[i]≤a[j]，则将第一个有序表中的元素a[i]复制到r[k]中，并令i和k分别加上1；否则将第二个有序表中的元素a[j]复制到r[k]中，并令j和k分别加上1，如此循环下去，直到其中一个有序表取完，然后再将另一个有序表中剩余的元素复制到r中从下标k到下标t的单元。

#算法逻辑比较简单，以第一个list为基准，第二个向第一个插空
def merge_sort(lists1,lists2):
    n1 = len(lists1)
    n2 = len(lists2)
    lists3 = []
    j = 0
    for i in range(n1):
        while lists2[j] < lists1[i] and j < n2:
            lists3.append(lists2[j])
            j = j+1
        lists3.append(lists1[i])
    if j < (n2-1):
        for k in range(j,n2):
            lists3.append(lists2[k])
    return lists3

2.6 堆排序

利用数组的特点快速定位指定索引的元素

堆分为大根堆和小根堆，是完全二叉树

基本思想：

1.最大堆调整(adjust_heap):将堆的末端子节点作调整，使得子节点永远小于父节点。这是核心步骤，在建堆和堆排序都会用到。比较i的根节点和与其所对应i的孩子节点的值。当i根节点的值比左孩子节点的值要小的时候，就把i根节点和左孩子节点所对应的值交换，当i根节点的值比右孩子的节点所对应的值要小的时候，就把i根节点和右孩子节点所对应的值交换。然后再调用堆调整这个过程，可见这是一个递归的过程。

2.建立最大堆(Build_Heap):将堆所有数据重新排序。建堆的过程其实就是不断做最大堆调整的过程，从len/2出开始调整，一直比到第一个节点。

3.堆排序(Heap_Sort):移除位在第一个数据的根节点，并做最大堆调整的递归运算。堆排序是利用建堆和堆调整来进行的。首先先建堆，然后将堆的根节点选出与最后一个节点进行交换，然后将前面len-1个节点继续做堆调整的过程。直到将所有的节点取出，对于n个数我们只需要做n-1次操作。

def heap_sort(lists):
    # 堆排序
    size = len(lists)
    build_heap(lists, size)
    for i in range(0, size)[::-1]:
        lists[0], lists[i] = lists[i], lists[0]
        adjust_heap(lists, 0, i)
    return lists


def adjust_heap(lists, i, size):
    # 调整堆
    lchild = 2 * i + 1
    rchild = 2 * i + 2
    maxi = i
    if lchild < size and lists[maxi] < lists[lchild]:
        maxi = lchild
    if rchild < size and lists[maxi] < lists[rchild]:
        maxi = rchild
    if maxi != i:
        # 如果做了堆调整则maxi的值等于左节点或者右节点的，这个时候做对调值操作
        lists[maxi], lists[i] = lists[i], lists[maxi]
        adjust_heap(lists, maxi, size)

def build_heap(lists, size):
    # 堆的构建
    for i in range(0, int((size/2)-1))[::-1]:
        adjust_heap(lists, i, size)

2.7 快速排序

快速排序是一种基于划分的排序方法

划分Partition思想：

选取待排序集合A中的某个元素t，按照与t的大小关系重新整理A中元素，使得整理后的序列中所有在t以前出现的
元素均小于t，而所有出现在t以后的元素均大于等于t；元素t称为划分元素。

反复地对A进行划分达到排序的目的。

划分算法：

对于数组A[0...n-1]:

设置两个变量i， j：i=0, j=n-1

以A[0]为关键数据，即key=A[0]

从j开始向前搜索，直到找到第一个小于key的值a[j]，将a[i] = a[j]；

从i开始向后搜索，直到找到第一个大于等于key的值a[i]，a[j] = a[i]；

重复第3、4步，直到i≥j.

def quick_sort(lists):
    less = []
    pivotList = []
    more = []
    if len(lists) <= 1:
        return lists
    else:
        pivot = lists[0]  # 将第一个值作为基准值
        for i in lists:
            if i < pivot:
                less.append(i)
            elif i > pivot:
                more.append(i)
            else:
                pivotList.append(i)
        less = quick_sort(less)
        more = quick_sort(more)
    return less + pivotList + more

2.8 计数排序

基本思想：对于每一个元素A[i]，确定小于a[i]的元素个数。所以直接可以把a[I]放到输出数组的相应位置上，比如有5个数小于a[i]，则a[i]应该放在输出数组的第六个位置上。

def count_sort(a, k):  # k = max(a)
    n = len(a)  # 计算a序列的长度
    b = [0 for i in range(n)]  # 设置输出序列并初始化为0
    c = [0 for i in range(k + 1)]  # 设置计数序列并初始化为0，
    for j in a:
        c[j] = c[j] + 1
    for i in range(1, len(c)):
        c[i] = c[i] + c[i-1]
    for j in a:
        b[c[j] - 1] = j
        c[j] = c[j] - 1
    return b

2.9 桶排序

基本思想：把数组A划分为n个大小相同的区间（即桶），每个子区间各自排序，最后合并。桶排序要求数据的分布必须均匀，否则可能会失效。计数排序是桶排序的一种特殊情况，可以把计数排序当成每个桶里只有一个元素的情况。

def bucket_sort(a):
    buckets = [0] * ((max(a) - min(a)) + 1)  # 初始化桶元素为0
    for i in range(len(a)):
        buckets[a[i] - min(a)] += 1  # 遍历数组a，在桶的相应位置累加值
    b = []
    for i in range(len(buckets)):
        if buckets[i] != 0:
            b += [i + min(a)] * buckets[i]
    return b

2.10 基数排序

基本思想：将待排序的数据按照位数切割成不同的数字，然后按每个位数分别比较。

基数排序可以采用两种方式：

LSD（Least Significant Digital）：从待排序元素的最右边开始计算（如果是数字类型，即从最低位个位开始）。

MSD（Most Significant Digital）：从待排序元素的最左边开始计算（如果是数字类型，即从最高位开始）。

def radix_sort(list, d=3): # 默认三位数，如果是四位数，则d=4，以此类推
    for i in range(d):  # d轮排序
        s = [[] for k in range(10)]  # 因每一位数字都是0~9，建10个桶
        for j in list:
            s[int(j / (10 ** i)) % 10].append(j)  
        re = [a for b in s for a in b]
    return re