数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000 ms Memory Limit: 65536 KiB
Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Sample Input
AAAAABCD
THE_CAT_IN_THE_HAT
Sample Output
64 13 4.9
144 51 2.8
Hint
Source
xam
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
#include<algorithm>
using namespace std;
void quq(int a[],int low,int righ)
{
int i,j;
if(low>=righ)return;
i=low;
j=righ;
int key=a[low];
while(i<j)
{
while(i<j&&a[j]>=key)j--;
a[i]=a[j];
while(i<j&&a[i]<=key)i++;
a[j]=a[i];
}
a[i]=key;
quq(a,low,i-1);
quq(a,i+1,righ);
}
int main()
{
char str[1000];
int a[1000],b[1000],c[1000];
while(scanf("%s",str)!=EOF)
{
int len,i,k=0,la,lh=0;
len=strlen(str);
int e;
la=8*len;
memset(a,0,sizeof(a));
for(i=0; i<len; i++)
{
e=str[i]-'0';
a[e]++;
}
for(i=0; i<555; i++)
{
if(a[i]!=0)
{
b[k++]=a[i];
}
}
int j=0;
quq(b,0,k-1);
while(k>1)
{
c[j]=b[0]+b[1];
b[1]=c[j];
for(i=0; i<k; i++)
{
b[i]=b[i+1];
}
j++;
k--;
quq(b,0,k-1);
}
for(i=0; i<j; i++)
lh+=c[i];
printf("%d %d %.1lf\n",la,lh,(1.0*la)/lh);
}
return 0;
}