[Algorithm] Counting Sort - 计数排序Python代码实现

计数排序的特征

当输入的元素是 n 个 0 到 k 之间的整数时,它的运行时间是 O(n + k)。计数排序不是比较排序,排序的速度快于任何比较排序算法。

由于用来计数的数组 C 的长度取决于待排序数组中数据的范围(等于待排序数组的最大值与最小值的差加上1),这使得计数排序对于数据范围很大的数组,需要大量时间和内存。

  • 例如:计数排序是用来排序 0 到 100 之间的数字的最好的算法,但是它不适合按字母顺序排序人名。但是,计数排序可以用在基数排序算法中,能够更有效的排序数据范围很大的数组。

  • 通俗地理解,例如有10个年龄不同的人,统计出有8个人的年龄比A小,那A的年龄就排在第9位,用这个方法可以得到其他每个人的位置,也就排好了序。当然,年龄有重复时需要特殊处理(保证稳定性),这就是为什么最后要反向填充目标数组,以及将每个数字的统计减去1。

算法的步骤如下:

  1. 找出待排序的数组中最大和最小的元素
  2. 统计数组中每个值为 i 的元素出现的次数,存入数组 C 的第 i 项
  3. 对所有的计数累加(从 C 中的第一个元素开始,每一项和前一项相加)
    反向填充目标数组:将每个元素 i 放在新数组的第 C[i] 项,每放一个元素就将 C[i] 减去1

适用场景

计数排序只能用在数据范围不大的场景中,如果数据范围 k 比要排序的数据 n 大很多,就不适合用计数排序了。而且,计数排序只能给非负整数排序,如果要排序的数据是其他类型的,要将其在不改变相对大小的情况下,转化为非负整数。

  • 比如,如果要求精确到小数后一位,就要将所有数据都先乘以 10,转化成整数。再比如,如果要排序的数据中有负数,数据的范围是[-1000, 1000],那就需要先对每个数据都加 1000,转化成非负整数。

计数排序属于线性排序的一种,也可理解为是桶排序的一种特殊情况。

时间复杂度:O(n)

def counting_sort(arr):
    if len(arr) <= 1: return

    # 假设数组中可能存在负数,将所有元素转化为非负整数
    m = min(arr)
    diff = 0
    if m < 0:
        diff = -m
        arr = [num + diff for num in arr]

    k = max(arr)
    counts = [0] * (k + 1)  # 创建计数数组
    for i in range(len(arr)):
        counts[arr[i]] += 1  # 计算每个元素的个数

    for i in range(1, k + 1):
        counts[i] += counts[i - 1]  # 计数依次累加

    result_arr = arr.copy()  # 创建数组存储排序后的结果
    for i in range(len(arr) - 1, -1, -1):	# 反向填充目标数组
        result_arr[counts[arr[i] - 1]] = arr[i] - diff
        counts[arr[i]] -= 1

    return result_arr

猜你喜欢

转载自blog.csdn.net/Treasure99/article/details/91447547
今日推荐