【问题描述】使用贪心算法求解Huffman编码问题,具体来说就是,根据每个字符的出现频率,使用最小堆构造最小优先队列,构造出字符的最优二进制表示,即前缀码。在程序开始说明部分,简要描述使用贪心算法求解Huffman编码问题的算法过程。
【输入形式】在屏幕上输入字符个数和每个字符的频率。
【输出形式】每个字符的Huffman编码。
【样例输入】
6
45 13 12 16 9 5
【样例输出】
a 0
b 101
c 100
d 111
e 1101
f 1100
【样例说明】
输入:字符个数为6,a至f每个字符的频率分别为:45, 13, 12, 16, 9, 5。
输出:每个字符对应的Huffman编码。
【评分标准】根据输入得到准确的输出。
'''哈夫曼树的构造(哈夫曼算法)
1.根据给定的n个权值{w1,w2,…,wn}构成二叉树集合F={T1,T2,…,Tn},其中每棵二叉树Ti中只有一个带权为wi的根结点,其左右子树为空.
2.在F中选取两棵根结点权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根结点的权值为左右子树根结点的权值之和.
3.在F中删除这两棵树,同时将新的二叉树加入F中.
4.重复2、3,直到F只含有一棵树为止.(得到哈夫曼树)'''
class Node(object): # 节点类,当树中叶节点最大数为n时,霍夫曼树的总节点数为2n-1
def __init__(self, name=None, value=None):
self._name = name
self._value = value
self._left = None
self._right = None
self._codevalue = '0'
# 哈夫曼树类
class HuffmanTree(object):
def __init__(self, char_weights): # 根据Huffman树的思想:以叶子节点为基础,反向建立Huffman树
self.codeway = {} # 存储节点对应的编码数,1or0
self.a = [Node(part[0], part[1]) for part in char_weights] # 根据输入的字符及其频数生成叶子节点
while len(self.a) != 1: # 如果没有到达根节点
self.a.sort(key=lambda node:node._value, reverse=True) # 根据节点的value进行从大到小的排序
c = Node(value=(self.a[-1]._value+self.a[-2]._value)) # 对于权值最小的两个节点加和作为新节点c的value
c._left = self.a.pop(-1) # 把排序完的树叶节点挂靠在c上,作为左右节点
c._right = self.a.pop(-1)
self.a.append(c) # bac作为节点连在树上
self.root = self.a[0]
def pre(self, tree, length, l, bb, cc):
if l == 0:
self.b = [0]*length
node = tree
if not node:
return
elif node._name:
cc.append(node._name-1)
ss = ""
for i in range(l):
ss += str(self.b[i])
bb.append(ss)
# print(ss)
return
# 是树的左子节点的话赋值为0,直到到达叶结点之后print了编码,再对考虑右子树
self.b[l] = 0
self.pre(node._left, length, l + 1, bb, cc)
self.b[l] = 1
self.pre(node._right,length, l + 1, bb, cc)
def code_way(self): # 生成哈夫曼编码
return self.codeway
def main():
bb = []
cc = []
n = int(input())
char_weights = [[0 for i in range(2)] for j in range(n)]
a = list(map(int, input().split()))
for i in range(n):
char_weights[i][0] = i+1
char_weights[i][1] = a[i]
# print(char_weights)
tree = HuffmanTree(char_weights)
length = len(char_weights)
tree.pre(tree.root, length, 0, bb, cc)
for i in range(n):
for j in range(n):
if cc[j] == i:
print(chr(i+97), end=' ')
print(bb[j])
if __name__ == '__main__':
main()