哈夫曼编码(python实现)

【问题描述】使用贪心算法求解Huffman编码问题,具体来说就是,根据每个字符的出现频率,使用最小堆构造最小优先队列,构造出字符的最优二进制表示,即前缀码。在程序开始说明部分,简要描述使用贪心算法求解Huffman编码问题的算法过程。

【输入形式】在屏幕上输入字符个数和每个字符的频率。

【输出形式】每个字符的Huffman编码。

【样例输入】

6

45 13 12 16 9 5

【样例输出】

a 0

b 101

c 100

d 111

e 1101

f 1100

【样例说明】

输入:字符个数为6,a至f每个字符的频率分别为:45, 13, 12, 16, 9, 5。

输出:每个字符对应的Huffman编码。

【评分标准】根据输入得到准确的输出。

'''哈夫曼树的构造(哈夫曼算法)
1.根据给定的n个权值{w1,w2,…,wn}构成二叉树集合F={T1,T2,…,Tn},其中每棵二叉树Ti中只有一个带权为wi的根结点,其左右子树为空.
2.在F中选取两棵根结点权值最小的树作为左右子树构造一棵新的二叉树,且置新的二叉树的根结点的权值为左右子树根结点的权值之和.
3.在F中删除这两棵树,同时将新的二叉树加入F中.
4.重复2、3,直到F只含有一棵树为止.(得到哈夫曼树)'''


class Node(object):  # 节点类,当树中叶节点最大数为n时,霍夫曼树的总节点数为2n-1
    def __init__(self, name=None, value=None):
        self._name = name
        self._value = value
        self._left = None
        self._right = None
        self._codevalue = '0'


# 哈夫曼树类
class HuffmanTree(object):
    def __init__(self, char_weights):  # 根据Huffman树的思想:以叶子节点为基础,反向建立Huffman树
        self.codeway = {}  # 存储节点对应的编码数,1or0
        self.a = [Node(part[0], part[1]) for part in char_weights]  # 根据输入的字符及其频数生成叶子节点
        while len(self.a) != 1:  # 如果没有到达根节点
            self.a.sort(key=lambda node:node._value, reverse=True)  # 根据节点的value进行从大到小的排序
            c = Node(value=(self.a[-1]._value+self.a[-2]._value))  # 对于权值最小的两个节点加和作为新节点c的value
            c._left = self.a.pop(-1)  # 把排序完的树叶节点挂靠在c上,作为左右节点
            c._right = self.a.pop(-1)
            self.a.append(c)  # bac作为节点连在树上
        self.root = self.a[0]

    def pre(self, tree, length, l, bb, cc):
        if l == 0:
            self.b = [0]*length
        node = tree
        if not node:
            return
        elif node._name:
            cc.append(node._name-1)
            ss = ""
            for i in range(l):
                ss += str(self.b[i])
            bb.append(ss)
            # print(ss)
            return

        # 是树的左子节点的话赋值为0,直到到达叶结点之后print了编码,再对考虑右子树
        self.b[l] = 0
        self.pre(node._left, length, l + 1, bb, cc)
        self.b[l] = 1
        self.pre(node._right,length, l + 1, bb, cc)

    def code_way(self):  # 生成哈夫曼编码
        return self.codeway


def main():
    bb = []
    cc = []
    n = int(input())
    char_weights = [[0 for i in range(2)] for j in range(n)]
    a = list(map(int, input().split()))
    for i in range(n):
        char_weights[i][0] = i+1
        char_weights[i][1] = a[i]
    # print(char_weights)
    tree = HuffmanTree(char_weights)
    length = len(char_weights)
    tree.pre(tree.root, length, 0, bb, cc)
    for i in range(n):
        for j in range(n):
            if cc[j] == i:
                print(chr(i+97), end=' ')
                print(bb[j])


if __name__ == '__main__':
    main()




发布了110 篇原创文章 · 获赞 15 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/qq_40486952/article/details/89716310
今日推荐