説明
文字エンコーディングの様々な身近なASCIIコード化、ハフマン符号化(ハフマン符号化)の符号化に加えて、存在することは、それは可変長符号化ワード長でも方法です。この方法は完全に最適な符号化と呼ばれる最短平均符号長を構成する文字の出現確率に基づいています。ハフマンしばしばデータファイルを圧縮するために使用されるコーディング、圧縮率は90%まで、典型的には20%の間です。あなたの仕事は、その長さの比であり、キーボードから入力した文字列のハフマン符号長のASCIIコードが得られます。
入力
入力データセットの複数の符号化される文字列を表す各データライン。
出力
文字の長さLa、LA / LH(小数点2桁目)、データ間隔の間の空間をコード長さLH及びハフマンの値に対応するASCIIコード。
サンプル
入力
AAAAABCD
THE_CAT_IN_THE_HAT
出力
64 13 4.9
144 51 2.8
#include<stdio.h>
#include<string.h>
#include<queue>
using namespace std;
char a[10000];
int b[1000];
int main()
{
int i,n,m,k,x1,x2;
priority_queue<int,vector<int>,greater<int> >que;//优先队列,从小到大排列,最上面的最小
while(scanf("%s",a)!=EOF)
{
k=0;
memset(b,0,sizeof(b));
n=strlen(a);
m=n*8;
for(i=0;i<n;i++)
b[a[i]]++;
for(i=0;i<150;i++)
if(b[i]!=0)
que.push(b[i]);
while(!que.empty())
{
x1=que.top();
que.pop();
if(!que.empty())
{
x2=que.top();
que.pop();
k+=(x1+x2);//每次都取最小的和次小的元素相加。
que.push(x1+x2);//将这两个的和放进去,再重新排列,最后求出是所有非叶子节点的和
}
}
printf("%d %d %.1lf\n",m,k,1.0*m/k);//ASCII编码长度为字符串长度乘8
}
return 0;
}