PTAハフマンコーディング
我々は文字の発生頻度をカウントする場合、テキストを与え、元のこの符号化圧縮符号化の最短全長を得ることができるように、ハフマン符号化アルゴリズムに従って与えることができます。しかし、ハフマン符号化は、一意ではありません。例えば、文字列「aaaxuaxz」、文字4,2,1,1の発生頻度に応じた '、「X」、「U」、「Z」を得ることは容易です。我々は、コード設計することができる{ 'U' = 110、= 10 '' = 0、 'X'、 'Z' = 111}、 '、別の集合{ ''= 1、 'X'= 01を使用することができますuが '= 001、' Z 'は= 0、' X '= 000}、また{使用することができる' '= 11、' U '= 100、' Z「= 101}三のエンコーディングは元に圧縮することができます14バイト。このコーディング00001011001001復号結果を用いて得られた圧縮」は、一意ではないので、{ '' = 0、 'X' = 01、 'U' = 011、 'z' は= 001}、ハフマン符号化ではありませんaaaxuaxz「および」aazuaxax「はデコード結果に対応してもよいです。この質問は、ハフマン符号化の任意のセットをコーディングするかどうかを判断するように求められます。
入力フォーマットは:
第一に、第二のラインに続く正の整数N(2≤N≤63)の最初の行は、N非反復文字や発生頻度を与え、次のフォーマット:C [1] F [1 ] C [2] F [2] ... 、C [N] F [N]
ここで、C [I]がセットされている{ '0' - ' ' '9' - 'Z'、 'A' - 'Z'、 '_'} 文字; F [I]は、c [i]はのあります発生頻度は1000を超えない整数です。次の行は、正の整数M(≤1000)を与えられ、その後、Mは、符号化の対象となるように設定されています。各フォーマットを表すN行コード:C [i]のコードを[I ]
C [I]は、i番目の文字である場合、コード[I]より63「0」以上であり、「1」が空でない文字列であります。
出力フォーマット:
各エンコーディングが押収するためにハフマン符号化が正しい場合は、それは、「Yes」の行で、さもなければ出力「いいえ」を出力します。
注:最適なエンコードがハフマンアルゴリズムでは必ずしもありません。任意の接頭コードが正しいと判断されなければならない最適な長さに圧縮することができます。
サンプル入力:
7
A B. 1. 1. 1 C D E. 3. 3 G F .. 6 6
4。
A 00000
B 00001
C 0001
D 001
E 01
Fで10
G. 11
A 01010
B 01011
C 0100
D 011
E 10
F .. 11
G 00
A 000
001 B
C 010
D 011
E 100
F. 101
G 110
A 00000
B 00001
C 0001
D 001
E 00
Fで10
G. 11
サンプル出力:
はい
はい
ません
非常に洗練されてみると、それは、また、非常にゆっくりと書くように注意し、書き込みに複雑ますが、難しいことではありませんゆっくりとそれがあるべき調整します。
我々は最初の数学はああ学ばなければならない、離散数学のこの部分について話しました、ハフマン木が最適な重みであることを理解しなければなりません。私たちは、この操作を続けることができ、一つのノードに二つの新しいノードの現在の最小重量を見つけることです。
この問題ハフマンツリーを構築し、入力がハフマン木であるかどうかを決定するためには、重量を最小限に抑えることができるが、ハフマンツリーのルールに準拠していない、つまり、すべてのコードは、接頭辞、他のノードに符号化されるべきではありません。
あなたは本当にそれを書き留めていないか、非常にそれを再現その後、退屈な時間を見つけてください。
さあ!
コード:
#include<bits/stdc++.h>
using namespace std;
typedef struct
{
int weight;//权重
int parent;//亲结点
} HTNode,*HuffmanTree;
void select(HuffmanTree &HT,int n,int &s1,int &s2)
{
int minum=0;//哈夫曼树中最小的权值d jie idan
//找到第一个没有双亲结点的结点,与其他结点的权值作比较
for(int i=1; i<=n; i++)
{
if(HT[i].parent==0)
{
{
minum=i;
break;
}
}
}
for(int i=1; i<=n; i++)
{
if(HT[i].parent==0)
if(HT[i].weight<HT[minum].weight)
minum=i;//找到权值最小而且没有亲结点的结点
}
s1=minum;
//找第二个值
for(int i=1;i<=n;i++)
{
if(HT[i].parent==0&&i!=s1)
{minum=i;break;}
}
for(int i=1; i<=n; i++)
{
if(HT[i].parent==0&&i!=s1)
{
if(HT[i].weight<HT[minum].weight)
minum=i;
}
}
s2=minum;
}
void HuffmanCoding(HuffmanTree &hf,int *a,int n)
{
int m=2*n-1;//有2n-1个节点
int min1,min2;
hf=(HuffmanTree)malloc((m+1)*sizeof(HTNode));
for(int i=1; i<=n; i++) //初始化原来存在的n个点
{
hf[i].weight=a[i];
hf[i].parent=0;
}
for(int i=n+1; i<=m; i++) //初始化2*n-1剩余的点
{
hf[i].weight=0;
hf[i].parent=0;
}
for(int i=n+1; i<=m; i++) //创建Huffman树
{
select(hf,i-1,min1,min2);//选当前没有父结点的两个权值最小的结点形成一个小树
hf[i].weight=hf[min1].weight+hf[min2].weight;
hf[min1].parent=i;
hf[min2].parent=i;
}
}
int main()
{
HuffmanTree hf;
int m,n;
char c[1003];
int a[1003];
cin>>m;
for(int i=0; i<m; i++)
{
cin>>c[i]>>a[i+1];//输入每个结点及其权值
}
HuffmanCoding(hf,a,m);//Huffman树创建完成
//验证
cin>>n;
int WPL = 0;//初始权值设为0
for(int i=1; i<2*m-1; i++)
{
WPL+=hf[i].weight;
}
for(int i=0; i<n; i++)
{
int sum=0;
string code[1003]="";
for(int j=0; j<m; j++)
{
cin>>c[j]>>code[j];
sum=sum+(a[j+1]*code[j].length());//求权值
}
if(sum!=WPL)
{
//cout<<WPL<<"&"<<sum;
cout<<"No"<<endl;
}//权值不是最小,直接排除
//权值符合,看是否编码规则符合Huffman树编码规则;
else
{
int flag=0;
for(int i=0; i<m; i++)
{
int len=code[i].length();
for(int j=0; j<m; j++)
{
int len_=code[j].length();
if(len<=len_&&i!=j)
{
if(code[i]==code[j].substr(0,len))
flag=1;
break;
}
}
if(flag)
break;
}
if(flag)
cout<<"No"<<endl;
else
cout<<"Yes"<<endl;
}
}
}