# -*- coding: utf-8 -*-
'''
Python程序员面试算法宝典---解题总结: 第4章 数组 4.24 如何对有大量重复的数字的数组排序
题目:
给定一个数组,已知这个数组中有大量的重复的数字,如何对这个数组进行高效地排序?
分析:
排序算法中用的比较多的是快速排序,堆排序。
谁符合大量重复数字排序的性能较好?
全部列出分析。
插入排序,快速排序
冒泡排序,堆排序
归并排序。
因为快速排序是每次确定枢轴的位置,
加入枢轴恰好大于重复数字,那么对这个枢轴排序好后,
应该能确定一批数字的顺序,所以推荐用快速排序。
如果是冒泡排序,每次迭代选取出一个最大的元素放置在数组末尾。
在数组已经排序完成的情况下仍然需要
比较,不推荐。
如果是插入排序,就是将待插入元素插入到前面已经排好序的
数组中。如果有重复元素,也是需要比较的,不见得效率多高。
不推荐。
堆排序,底层不断和父节点比较,将最大的值移动到堆顶,
然后将堆顶和最后面的元素交换,如果存在很多重复的元素,‘
就不需要交换,可能是。
归并排序,似乎和重复元素多少没有关系。
如果是比较排序,将当前元素和数组剩余元素比较,将最小值放在前面。
似乎和重复元素多少没有关系。
结论:
用快速排序。
关键:
1 书上解法
哈希法,遍历数组。建立:
<数字,该数字出现次数>的字典,然后输出的时候,根据当前数字出现次数的多少
输出多少个这样的数字
2 我没想到
是因为忘记了 编程珠玑中的确有哈希排序的做法。
参考:
Python程序员面试算法宝典
'''
def hashSort(array):
if not array:
return
sortDict = {}
for value in array:
if value not in sortDict:
sortDict[value] = 1
else:
sortDict[value] += 1
index = 0
for value, count in sortDict.iteritems():
for i in range(count):
array[index] = value
index += 1
return array
def process():
array = [1, 6, 3, 7, 5, 6, 5, 2, 6]
result = hashSort(array)
print result
if __name__ == "__main__":
process()