Python程序员面试算法宝典---解题总结: 第4章 数组 4.24 如何对有大量重复的数字的数组排序

# -*- coding: utf-8 -*-

'''
Python程序员面试算法宝典---解题总结: 第4章 数组 4.24 如何对有大量重复的数字的数组排序

题目:
给定一个数组,已知这个数组中有大量的重复的数字,如何对这个数组进行高效地排序?

分析:
排序算法中用的比较多的是快速排序,堆排序。
谁符合大量重复数字排序的性能较好?
全部列出分析。
插入排序,快速排序
冒泡排序,堆排序
归并排序。

因为快速排序是每次确定枢轴的位置,
加入枢轴恰好大于重复数字,那么对这个枢轴排序好后,
应该能确定一批数字的顺序,所以推荐用快速排序。

如果是冒泡排序,每次迭代选取出一个最大的元素放置在数组末尾。
在数组已经排序完成的情况下仍然需要
比较,不推荐。
如果是插入排序,就是将待插入元素插入到前面已经排好序的
数组中。如果有重复元素,也是需要比较的,不见得效率多高。
不推荐。
堆排序,底层不断和父节点比较,将最大的值移动到堆顶,
然后将堆顶和最后面的元素交换,如果存在很多重复的元素,‘
就不需要交换,可能是。
归并排序,似乎和重复元素多少没有关系。
如果是比较排序,将当前元素和数组剩余元素比较,将最小值放在前面。
似乎和重复元素多少没有关系。
结论:
用快速排序。

关键:
1 书上解法
哈希法,遍历数组。建立:
<数字,该数字出现次数>的字典,然后输出的时候,根据当前数字出现次数的多少
输出多少个这样的数字

2 我没想到
是因为忘记了 编程珠玑中的确有哈希排序的做法。

参考:
Python程序员面试算法宝典
'''


def hashSort(array):
    if not array:
        return
    sortDict = {}
    for value in array:
        if value not in sortDict:
            sortDict[value] = 1
        else:
            sortDict[value] += 1
    index = 0
    for value, count in sortDict.iteritems():
        for i in range(count):
            array[index] = value
            index += 1
    return array


def process():
    array = [1, 6, 3, 7, 5, 6, 5, 2, 6]
    result = hashSort(array)
    print result


if __name__ == "__main__":
    process()

猜你喜欢

转载自blog.csdn.net/qingyuanluofeng/article/details/93708785