【数据结构与算法】之十大常用排序算法

排序算法的对比

排序算法	平均时间复杂度	最好情况	最坏情况	空间复杂度	排序方式	稳定性
冒泡排序	O(n²)	O(n)	O(n²)	O(1)	In-place	稳定
选择排序	O(n²)	O(n²)	O(n²)	O(1)	In-place	不稳定
插入排序	O(n²)	O(n)	O(n²)	O(1)	In-place	稳定
希尔排序	O(n log n)	O(n log²n)	O(n log²n)	O(1)	In-place	不稳定
归并排序	O(n log n)	O(n log n)	O(n logⁿ)	O(n)	Out-place	稳定
快速排序	O(n log n)	O(n log n)	O(n²)	O(1)	In-place	不稳定
堆排序	O(n log n)	O(n log n)	O(n log n)	O(1)	In-place	不稳定
计数排序	O(n+k)	O(n+k)	O(n+k)	O(k)	Out-place	稳定
桶排序	O(n+k)	O(n+k)	O(n²)	O(n+k)	Out-place	稳定
基数排序	O(d(n+k))	O(d(n+k))	O(d(n+k))	O(n+k)	Out-place	稳定

计数排序中的k指的是最大数值和最小数值的差值；
桶排序中的k指的是分成多少个桶；
桶排序虽然排序需要遍历k遍，但是由于每个桶可以采取不同的排序方法，比如：统一采取平均时间复杂度为O(nlogn)的排序方法，则平均时间复杂度为：O(O(n+n(logn-logk)))。不仅时间复杂度和桶里数据采取的排序算法有关，连稳定性也是，比如，采取不稳定的算法，就有可能是不稳定的排序算法。
基数排序中的k指的是进制中的基数，比如：十进制就是10；
基数排序中的d指的是最大数值的位数，比如：max=1000，则d=4；
基数排序虽然将排好的数据重新写回去需要遍历k遍，但是，其实还是需要访问n个数据，其实时间复杂度可以写成：O(dn)。

排序算法使用

一、冒泡排序法

两两相邻的数据比较，如果前面的数据比后面的数据大，则交换两个数据的位置，直到所有的数据有序。

冒泡排序法

思路步骤

   * 比较相邻的元素。如果第一个比第二个大，就交换他们两个，直到把最大的元素放到数组尾部。
   * 遍历长度减一，对剩下的元素从头重复以上的步骤。
   * 直到没有任何一对数字需要比较时完成。

最好时间复杂度：最好的情况就是需要排序的数据完全有序，也就是只需要比较n-1次，移动0次，就可以得到一个完全有序的序列，所以时间复杂度为：O(n)。
最坏时间复杂度：需要排序的数据逆序，那么第一个数据需要比较n-1次，第二个数据需要比较n-2次，那么，总的比较时间为：n-1+n-2+n-3+…+1=(n² - n)/2，也就是时间复杂度为：O(n²)。
平均时间复杂度：(O(n) + O(n²))/2 = O(n²)。
空间复杂度：因为排序是在原数组上进行交换和移动的，也就是不需要额外的辅助空间，严谨来说交换数据时需要一个临时的空间，所以空间复杂度为：O(1)。
稳定性：因为是相邻的元素两两比较，不存在跳跃比较，移动的情况，所以是稳定的排序。
排序类型：因为每次比较需要用到整个数组，即需要把排序的数据一次性加载到内存里进行排序，所以是内排类型。
实现逻辑

// 方法一
func bubbleSort(sortedList: inout [Int]) {
    var i : Int = 1
    var flag = true

    while i < sortedList.count && flag {
        flag = false
        for j in 0 ..< sortedList.count-i {
            if sortedList[j] > sortedList[j+1] {
                flag = true
                sortedList.swapAt(j, j+1)
            }
        }
        i++
    }
}

// 方法二
func bubbleSort(data : [Int]) -> [Int] {
    var list = data
    for i in 0 ..< list.count {
        for j in i+1 ..< list.count {
            if list[j] > list[i] {
                let temp = list[j]
                list[j] = list[i]
                list[i] = temp
            }
        }
    }
    return list
}

二、选择排序法

选择排序，每次都在无序的数据中选出最大的数据，并排在后面，直到所有的数据有序。
原理：首先在未排序序列中找到最小（大）元素，存放到排序序列的起始位置，然后，再从剩余未排序元素中继续寻找最小（大）元素，然后放到已排序序列的末尾。以此类推，直到所有元素均排序完毕。
思路步骤

   * 遍历数组，找到最小的元素，将其置于数组起始位置
   * 从上次最小元素存放的后一个元素开始遍历至数组尾，将最小的元素置于开始处
   * 重复上述过程，直到元素排序完毕

时间复杂度：选择排序比较特殊，无论排序的数据是有序还是无序，时间复杂度都是一样的。因为就算整个数据有序，但是不将所有的数据比较一次，是不可能知道这个数据就是最大或者最小的，虽然人眼是能看出来，但是机器看不出，所以，时间复杂度为：O(n²)。
空间复杂度：和冒泡排序一样，最多使用一个数据空间，所以空间复杂度为：O(1)。
稳定性：因为需要在剩下的所有数据中寻找最大值，存在跳跃的情况，比如：5 4 5 3 2 => 4 3 5 2 5 很明显前面的5跑到后面来了，所以是不稳定的。
排序类型：同冒泡排序一样，需要一次性把排序的数据加载到内存，所以是内排。
实现逻辑

// 方法一
func simpleSelectSort(sortedList : inout [Int]) {
    for j in 0 ..< sortedList.count-1 {
        for i in j+1 ..< sortedList.count {
            if sortedList[j] > sortedList[i] {
                sortedList.swapAt(j, i)
            }
        }
    }
}

// 方法二
func chooseSort(data:[Int]) -> [Int] {
    var list = data
    for i in 0 ..< list.count {
        // 记录当前最小的数，比较i+1后更大的数进行记录
        var min = i
        for j in i+1 ..< list.count {
            if list[j] < list[min] {
                min = j
            }
        }
        let temp = list[min]
        list[min] = list[i]
        list[i] = temp
    }
    return list
}

三、插入排序法

插入排序是不断的将数据插入前面有序的序列，形成新的有序序列。

插入排序法

思路步骤

   * 从第一个元素开始，该元素可以认为已经被排序
   * 取出下一个元素，在已经排序的元素序列中从后向前扫描
   * 如果该元素（已排序）大于新元素，将该元素移到下一位置
   * 重复步骤3，直到找到已排序的元素小于或者等于新元素的位置
   * 将新元素插入到该位置后
   * 重复步骤2~5

最好时间复杂度：如果排序的数据完全有序，则只需要比较n-1次，不需要移动数据，则最好的时间复杂度为：O(n)。
最坏时间复杂度：如果排序的数据逆序，从第二数据开始，第一次在比较是否进入循环时，比较了一次，然后在循环比较移动时有比较了一次，也就是两次，总的时间复杂度为：2+3+4+…+n=(n+2)(n-1)/2，时间复杂度为：O(n²)。
平均时间复杂度：O(n²)。
稳定性：因为插入排序是一个一个数插入，也是相邻两个数据两两比较，不存在跳跃比较和移动的情况，所以是稳定的。
排序类型：同冒泡排序一样，需要一次性把排序的数据加载到内存，所以是内排。
实现逻辑

// 方法一：通过移动
func insertSort(sortedList: inout [Int]) {
    for j in 1 ..< sortedList.count {
        if sortedList[j] < sortedList[j-1] {
            let temp = sortedList[j]
            var i : Int = j-1
            while i >= 0 && sortedList[i] > temp {
                sortedList[i+1] = sortedList[i]
                i--
            }
            sortedList[i+1] = temp
        }
    }
}

// 方法二：通过交换
func insertSort(data:[Int]) -> [Int] {
    var list = data
    for i in 1..<list.count {
        // 从i往前找，符合条件交换
        var y = i
        while y > 0 && list[y] > list[y-1] {
            let temp = list[y]
            list[y] = list[y-1]
            list[y-1] = temp
            y -= 1
        }
    }
    return list
}

// 方法三
func insertSort(list:[Int]) -> [Int] {
    // 建立一个空数，符合条件的插入，没插入的尾后添加
    var nlist = [list[0]]
    for i in 1 ..< list.count {
        var max: Int? = nil
        for j in 0 .. < nlist.count {
            if list[i] > nlist[j] {
                max = i
                nlist.insert(list[i], at: j)
                break
            }
        }
        if max == nil {
            nlist.append(list[i])
        }
    }
    return nlist
}

四、希尔排序法

希尔排序是插入排序的升级版，通过设置increment（增量），把数组分成increment组，分别进行插入排序。然后，increment不断的减少，最终一定是increment=1，也就是整个数组进行插入排序，得出有序的序列。
思路步骤

   * 希尔排序是把记录按下标的一定增量分组，对每组使用直接插入排序算法排序；
   * 随着增量逐渐减少，每组包含的关键词越来越多，当增量减至1时，整个文件恰被分成一组，算法便终止。

时间复杂度：因为希尔排序是通过不同的增量来进行分组，然后每组进行插入排序的，也就是说增量的取值直接影响到希尔排序的时间复杂度。但是，希尔排序说到底属于插入排，那么一开始increment=1，也就是希尔排序的最好时间复杂度和最坏时间复杂度都是和插入排序相同的，也就是O(n)~O(n²) ，平均时间复杂度比较复杂，由于不同的增量取值，导致时间不一样，有时间复杂度为O(n^1.3) 和O(n^1.5)的增量取值。
空间复杂度：和插入排序一样，空间复杂度为O(1)。
稳定性：因为希尔排序是增量插入排序，存在跳跃比较和移动的情况，所以是不稳定的排序。
排序类型：内排。
实现逻辑

// 方法一
func shellSort(sortedList : inout [Int]) {
    let length = sortedList.count
    var increment = length

    repeat {
        increment = increment/3+1
        for i in 0 ..< length {
            if i >= increment && sortedList[i] < sortedList[i-increment] {
                let temp = sortedList[i]
                var j : Int = i-increment
                while j >= 0 && sortedList[j] > temp {
                    sortedList[j+increment] = sortedList[j]
                    j -= increment
                }
                sortedList[j+increment] = temp
            }
        }
    } while increment > 1
}

// 方法二
func shellSort(arr: inout [Int]) {
    var j: Int
    // 获取增量
    var gap = arr.count / 2
    
    while  gap > 0 {
        for i in 0 ..< gap {
            j = i + gap
            while j < arr.count {
                if arr[j] < arr[j - gap] {
                    let temp = arr[j]
                    var k = j - gap
                    // 插入排序
                    while (k >= 0 && arr[k] > temp) {
                        arr[k + gap] = arr[k]
                        k -= gap
                    }
                    arr[k + gap] = temp
                }
                j += gap
            }
        }
        // 增量减半
        gap /= 2
    }
}

五、快速排序法

快速排序是冒泡排序的升级版，归根到底是比较排序的一种。通过关键数，将数组分成左右两个数组，左边都小于关键数，右边都大于关键数，然后左右两个数组继续分下去，直到所有数据都有序。
思路步骤

   * 从数列中挑出一个元素，称为 “基准”（pivot）
   * 重新排序数列，所有元素比基准值小的摆放在基准前面，所有元素比基准值大的摆在基准的后面（相同的数可以到任一边）。在这个分区退出之后，该基准就处于数列的中间位置。这个称为分区（partition）操作
   * 递归地（recursive）把小于基准值元素的子数列和大于基准值元素的子数列排序

最好时间复杂度：快速排序不断的把数组分成两边，相当于一棵二叉树，由二叉树的知识可以知道，完全二叉树的深度最小，为depth = log n +1，也就是说，当数据比较均匀的分布在二叉树的左右两边，则时间复杂度最小。假设快速排序的时间复杂度为：T(n)，第一次需要遍历整个数据，然后把数据分成均匀的两部分，则时间复杂度为：T(n)=2T(n/2)+n，同理，T(n/2)=2T(n/4)+n/2，T(n/4)=2T(n/8)+n/8，则T(n)=2T(n/2)+n=2(2T(n/4)+n/2)+n=4T(n/4)+2n=4(2T(n/8)+n/4)+2n=8T(n/8)+3n=…=nT(n/n)+nlogn=nT(1)+nlogn=nlogn。因为完全二叉树的深度为logn，所以递归调用了logn次，并且直到分到叶子结点，也就是T(1)，T(1)=0，所以，T(n)=nlogn。因此，快速排序的时间复杂度为：O(nlogn)。
最坏时间复杂度：由二叉树的知识可以直到，斜树的深度最大，为depth=n，也就是当整个数组元素构造成一棵斜树，那么，该时间复杂度最高。由最好时间复杂度得出的公式，可以用在最坏时间复杂度的计算，也就是：T(n)=T(n-2)+n-1=T(n-3)+n-1+n-2=T(n-4)+n-1+n-2+n-3=…=n-1+n-2+n-3+…+1=((n-1)*n)/2，所以，最坏时间复杂度为：O(n²)。
空间复杂度：最好的情况，需要进行logn次递归，所以空间复杂度为：O(logn)，最坏的情况，需要进行n-1次递归，所以空间复杂度为：O(n)，因此，空间复杂度为：O(logn)~O(n)。
稳定性：存在数据元素跳跃的问题，是不稳定的排序。
实现逻辑

// 方法一
 func fastSort(sortedList : inout [Int]) {
    sort(sortedList: &sortedList, start: 0, end: sortedList.count-1)
 }

 func sort(sortedList: inout [Int], start: Int, end: Int) {
    if start < end {
        let m = partion(sortedData: &sortedList, start: start, end: end)
        sort(sortedList: &sortedList, start: start, end: m-1)
        sort(sortedList: &sortedList, start: m+1, end: end)
    }
 }

 func partion(sortedData: inout [Int], start: Int, end: Int) -> Int {
    let pivot = sortedData[start]
    var left = start
    var right = end

    while left < right {
        while left < right && sortedData[right] >= pivot {
            right--
        }
        sortedData.swapAt(left, right)
        while left < right && sortedData[left] <= pivot {
            left++
        }
        sortedData.swapAt(left, right)
    }
    return left
 }

// 方法二
func quickSort(list: inout [Int], left: Int, right: Int) {
    // 左边往右边移，右边往左边移动，最后过了就停止
    if left > right {
        return
    }
    
    var i, j, pivot: Int
    i = left
    j = right
    pivot = list[left]
    
    while i != j {
        // 右边大的往左移动
        while list[j] <= pivot && i < j {
            j -= 1
        }
        // 左边小的往右移动
        while list[i] >= pivot && i < j {
            i += 1
        }
        // 找到两个对方区域的值进行交换
        if i < j {
            let temp = list[i]
            list[i] = list[j]
            list[j] = temp
        }
    }
    // 此时i和j相等，处于中间位置，替换pivot值
    list[left] = list[i]
    list[i] = pivot
    
    // 重复以上动作
    quickSort(list: &list, left: left, right: i-1)
    quickSort(list: &list, left: i+1, right: right)
}

六、归并排序法

先没两个数据元素归并成一个有序的整体，然后有序的整体再两两归并成一个更大的有序整体，直到归并所有的数据元素，形成一个有序的整体。
时间复杂度：因为两两归并，其实就是一棵完全二叉树，所以，最好和最坏的时间复杂度都是一样的，二叉树的深度为：logn，并且需要比较n次，所以为：O(nlogn)。
空间复杂度：需要n个额外的辅助空间存结果，并且需要递归logn次，所以空间复杂度为：O(n+logn)，但是如果不采用递归，则需要：O(n)个空间。
稳定性：因为两个有序的整体merge的时候并不涉及到数据的跳跃比较和移动，所以是稳定的。
排序类型：外排，因为不需要刚开始就把所有的数据加载进内存进行排序。
实现逻辑

 func mergeSort(sortedList: inout [Int]) {
    var result: [Int] = Array.init(repeating: 0, count: sortedList.count)
    sort(sortedList: &sortedList, result: &result, start: 0, end: sortedList.count-1)
 }

 func sort(sortedList: inout [Int], result: inout [Int], start: Int, end: Int) {
    var result2: [Int] = Array.init(repeating: 0, count: MAXSIZE)
    if start == end {
        result[start] = sortedList[start]
    } else {
        let m = (end+start)/2
        sort(sortedList: &sortedList, result: &result2, start: start, end: m)
        sort(sortedList: &sortedList, result: &result2, start: m+1, end: end)
        merge(left: &result2, right: &result, start: start, middle: m, end: end)
    }
 }

 func merge(left: inout [Int], right: inout [Int], start: Int, middle: Int, end: Int) {
    var i = start, j = middle+1, k = start
    while i <= middle && j <= end {
        if left[i] < left[j] {
            right[k] = left[i]
            i++
        } else {
            right[k] = left[j]
            j++
        }
        k++
    }

    if i <= middle {
        for l in 0...middle-i {
            right[k+l] = left[i+l]
        }
    }
    if j <= end {
        for l in 0...end-j {
            right[k+l] = left[j+l]
        }
    }
 }

七、堆排序法

堆排序是选择排序的升级版，通过一次次的构建大顶堆，不断获取堆中最大的数据，直到堆中没有数据，也就是所有数据都有序了。
思路步骤

   * 最大堆调整（Max_Heapify）：将堆的末端子节点作调整，使得子节点永远小于父节点
   * 创建最大堆（Build_Max_Heap）：将堆所有数据重新排序
   * 堆排序（HeapSort）：移除位在第一个数据的根节点，并做最大堆调整的递归运算

最好时间复杂度：开始就是大顶堆，第一次构建，只需要比较，不需要移动，所有的数据至少需要比较一次，时间复杂度为：O(n)。然后，从第二次开始，由于每次都是取叶结点的数据取代根结点，所以，每次都需要比较和移动logi(i为当前构建大顶堆的结点数)，也就是时间复杂度为：log(n-1)+log(n-2)+…+log(1)=log((n-1)!)=(n-1)log(n-1)，也就是时间复杂度为：O(nlogn)。
最坏时间复杂度：开始就是小顶堆，第一次构建，每个数据都需要比较和移动，也是O(n)的复杂度。从第二次开始，其实和最好情况的大顶堆是一样的，都需要比较和移动那么多的次数，时间复杂度都是：O(nlogn)。
空间复杂度：因为没有额外的辅助空间，所以，时间复杂度为：O(1)。
稳定性：因为存在跳跃的移动，所以是不稳定的排序。
实现逻辑

 func heapSort(sortedList: inout [Int]) {
    sortedList.insert(sortedList.count, at: 0)
    let length = sortedList[0]

    for i in stride(from: length/2, through: 1, by: -1) {
        headAdjust(sortedList: &sortedList, index: i, length: length)
    }

    for i in stride(from: length, to: 1, by: -1) {
        sortedList.swapAt(1, i)
        headAdjust(sortedList: &sortedList, index: 1, length: i-1)
    }

    sortedList.removeFirst()
 }

 func headAdjust(sortedList: inout [Int], index: Int, length: Int) {
    let temp = sortedList[index]
    // 根, index从1开始算
    var s = index;  
    // 左子树
    var j = index*2  
    while j <= length {
        if j < length && sortedList[j] < sortedList[j+1] {
            j++
        }
        if temp >= sortedList[j] {
            break
        }
        sortedList[s] = sortedList[j]
        s = j;
        j = s*2  //左子树
    }
    sortedList[s] = temp
 }

八、计数排序法

适用于整数，分布均匀的数据。先找到整个数组最小和最大的整数，然后生（max-min+1）长度的数组，遍历整个数组，最小的放在第一位，最大的放在最后一位，其他数据的位置根据和最小数据的差值放置相应小标的位置，只需遍历一遍就可以把整个数组的数据变成有序。

九、桶排序法

计数排序的升级版，计数排序可以看作分成max-min+1个桶的排序。桶排序在计数排序的基础上，将max-min+1的数据段再分成k个桶，每个桶就是一个数据段，所有的桶数据段不会重叠，并且所有桶的数据段连起来就是max-min+1，先将所有数据加入桶里，然后桶里的数据再采用其他排序使桶里的数据有序，然后将所有桶的数据连接起来就是整个有序序列。
最好时间复杂度：整个数据均匀分布在n个桶里，时间复杂度为：O(n)。
最坏时间复杂度：所有数据都在一个桶里，则时间复杂度为：O(n²)。
平均时间复杂度：遍历需要n遍，排序需要k遍，即时间复杂度为：O(n+km)(m和桶采取的排序算法有关)。假如，桶采取的排序算法平均的时间复杂度为O(nlogn)，则O(n+k(n/k)log(n/k))=O(n+n(logn-logk))=O(n+m)(m=n(logn-logk))。
空间复杂度：需要额外k个桶作为辅助，并且排序结果也需要n个位置储存数据，所以为：O(n+k)。
稳定性：因为桶里的排序用到的是插入排序，所有是稳定的。
实现逻辑

 func bucketSort(sortedList: [Int]) -> [Int] {
    let max = sortedList.max()!
    let min = sortedList.min()!
    let bucketSize = 20
    let bucketCount = (max-min)/bucketSize+1
    var buckets = Array.init(repeating: [Int](), count: bucketCount)
    for num in sortedList {
        let i = (num-min)/bucketSize
        var bucket = buckets[i]
        bucket.append(num)
        buckets[i] = bucket 
    }
    var result = [Int]()
    for var bucket in buckets {
        // 桶里采用插入排序
        insertSort(sortedList: &bucket) 
        result.append(contentsOf: bucket)
    }
    return result
 }

十、基数排序法

将数字按不同的数位比较，从低位到高位，位数不足的补零。也就是先按照各位排序，然后再按照十位排序，再按照百位排序…直到最高位。
时间复杂度：时间复杂度和maxDigit有关，并且遍历整个数组需要n遍，然后将所有桶的数组按顺序加入结果数组，所以，还需要加上遍历桶的数据的次数，则和k有关。所以，时间复杂度为：O(d(n+k))，k为基数，比如十进制k就是10。
空间复杂度：因为用到了结果数据和基数个桶，所以为：O(n+k)。
稳定性：稳定的，因为不会改变相同两个数据的前后关系。
排序类型：外排。
实现逻辑

 func radixSort(sortedList: [Int]) -> [Int] {
    let max = sortedList.max()!
    var result = Array.init(sortedList)
    var buckets = Array.init(repeating: [Int](), count: 10)
    let maxDigit = "\(max)".count
    for i in 0 ..< maxDigit {  // d
        let mod = (pow(10, i+1) as NSDecimalNumber).intValue
        for num in result { // n
            let j = num%mod/(mod/10)
            var bucket = buckets[j]
            bucket.append(num)
            buckets[j] = bucket
        }
        var index = 0
        for j in 0 ..< buckets.count {  // k
            let bucket = buckets[j]
            for k in 0..<bucket.count {
                result[index+k] = bucket[k]
            }
            index = index+bucket.count
            buckets[j] = []
        }
    }
    return result
 }

【数据结构与算法】之十大常用排序算法

排序算法的对比

排序算法使用

一、冒泡排序法

二、选择排序法

三、插入排序法

四、希尔排序法

五、快速排序法

六、归并排序法

七、堆排序法

八、计数排序法

九、桶排序法

十、基数排序法

猜你喜欢