A - 数据结构实验之二叉树六:哈夫曼编码

Description

字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input

输入数据有多组,每组数据一行,表示要编码的字符串。
Output

对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Sample

Input

AAAAABCD
THE_CAT_IN_THE_HAT

Output

64 13 4.9
144 51 2.8

#include<stdio.h>
#include<string.h>
#include<queue>
using namespace std;
char a[10000];
int b[1000];

int main()
{
    int i,n,m,k,x1,x2;
    priority_queue<int,vector<int>,greater<int> >que;//优先队列,从小到大排列,最上面的最小
    while(scanf("%s",a)!=EOF)
    {
        k=0;
        memset(b,0,sizeof(b));
        n=strlen(a);
        m=n*8;
        for(i=0;i<n;i++)
            b[a[i]]++;
        for(i=0;i<150;i++)
            if(b[i]!=0)
            que.push(b[i]);
        while(!que.empty())
        {
           x1=que.top();
           que.pop();
           if(!que.empty())
           {
               x2=que.top();
           que.pop();
           k+=(x1+x2);//每次都取最小的和次小的元素相加。
           que.push(x1+x2);//将这两个的和放进去,再重新排列,最后求出是所有非叶子节点的和
           }
        }
        printf("%d %d %.1lf\n",m,k,1.0*m/k);//ASCII编码长度为字符串长度乘8
        }
        return 0;
}
发布了177 篇原创文章 · 获赞 7 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/Fusheng_Yizhao/article/details/104873442