哈夫曼树的构建及应用

原文链接: http://www.cnblogs.com/wuhenxiansen/p/10390400.html

哈夫曼树,又称最优树,是一类带权路径最短的树。

哈夫曼树和哈夫曼的存储表示:

typedef struct{
    unsigned int weight;
    unsigned int parent,lchild,rchild;
}HTNode,*HuffmanTree;//动态分配数组存储哈夫曼树
typedef char **HuffmanCode;//动态分配数组存储哈夫曼编码表

应用:

【问题描述】

利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。但是,这要求在发送端通过一个编码系统对待传输数据预先编码,在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要一个完整的编/译码系统。试为这样的信息收发站写一个哈夫曼的编/译码系统。

【基本要求】

一个完整的系统应具有以下功能:

(1) I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。

(2) E:编码(Encoding)。利用以建好的哈夫曼树(如不在内存,则从文件hfmTree中读入),对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。

(3) D:译码(Decoding)。利用已经建好的哈夫曼树将文件CodeFile中的代码进行译码,结果存入文件TextFile中。

(4) P:打印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上,每行50个代码,同时将此字符形式的编码写入文件CodePrint中。

(5) T:打印哈夫曼树(Tree printing)。将已经在内存中的哈夫曼树以直观的方式(树或凹入表形式)显示在终端上,同时将此字符形式的哈夫曼树写入文件TreePrint中。

【测试数据】

(1) 利用教科书例6-2中的数据调试程序。

(2) 用下表给出的字符集和频度的实际统计数据建立哈夫曼树,并实现以下报文的编码和译码:“THIS PROGRAM IS MY FAVORITE”。

字符

       A     B    C    D     E    F    G    H    I    J    K     L    M

频度

186   64    13    22   32  103    21   15   47   57   1    5     32   20

字符

N     O     P    Q    R     S    T    U    V    W    X    Y     Z

频度

57    63    15    1    48    51   80   23   8    18   1    16    1

【实现提示】

(1) 编码结果以文本式存储在文件CodeFile中。

(2) 用户界面可以设计为“菜单”方式:显示上述功能符号,再加上“Q”,表示退出运行Quit。请用户键入一个选择功能符。此功能执行完毕后再显示此菜单,直至某次用户选择了“Q”为止。

(3) 在程序的一次执行过程中,第一次执行I,D或C命令之后,哈夫曼树已经在内存了,不必再读入。每次执行中不一定执行I命令,因为文件hfmTree可能早已建好。

【选作内容】

(1) 上述文件CodeFile中的每个“0”或“1”实际上占用了一个字节的空间,只起到示意或模拟的作用。为最大限度地利用码点存储能力,试改写你的系统,将编码结果以二进制形式存放在文件CodeFile中。

(2) 修改你的系统,实现对你的系统的源程序的编码和译码(主要是将行尾符编/译码问题)。

(3) 实现各个转换操作的源/目的文件,均由用户在选择此操作时指定。

#include<iostream.h>
//using namespace std;
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
#include<fstream.h>
#define num 1000
typedef struct//哈夫曼树的结构体
{
    char ch;
    int weight;//权值
    int parent,lchild,rchild;
}HTNode,*HuffmanTree;
typedef char **HuffmanCode;
void Select(HuffmanTree &HT,int a,int *p1,int *p2)
//Select函数,选出HT树到a为止,权值最小且parent为0的2个节点
{
    int i,j,x,y,count,temp;
    for(j=1,count=1;j<=a;j++)
    {
        if(HT[j].parent==0)
        {
            if(count==1)
                x=j;
            if(count==2)
                y=j;
            count++;            
        }
        if(count>2)
            break;
    }

    if(HT[x].weight>HT[y].weight)//令x结点权值小于y结点权值
    {
        temp=y;
        y=x;
        x=temp;
    }
    i=(x>y?x:y)+1;
    while(i<=a)
    {
        if(HT[i].parent==0)
        {
            if(HT[i].weight<HT[x].weight)
            {
                y=x;
                x=i;
            }
            else
            {
                if(HT[i].weight>=HT[x].weight&&HT[i].weight<HT[y].weight)
                    y=i;
            }
        }
        i++;
    }
    *p1=HT[x].weight<=HT[y].weight?x:y;
    *p2=HT[x].weight>HT[y].weight?x:y;


}
void HuffmanCoding(HuffmanTree &HT,HuffmanCode &HC,int n)//构建赫夫曼树HT,并求出n个字符的赫夫曼编码HC
{
    int i,start,c,f,m,w;
    int p1,p2;
    char *cd,z;
    if(n<=1)
        exit(1);
    m=2*n-1;//n个叶子结点的哈夫曼树共有2n-1个结点
    HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));//0号单元未使用
    for(i=1;i<=n;i++)//初始化n个叶子结点
    {
        printf("请输入第%d字符信息和权值:",i);
        scanf("%c%d",&z,&w);
        while(getchar()!='\n')
        {
            continue;
        }
        HT[i].ch=z;
        HT[i].weight=w;
        HT[i].parent=0;
        HT[i].lchild=0;
        HT[i].rchild=0;
    }
    for(i=n+1;i<=m;i++)//初始化其余结点
    {
        HT[i].ch='0';
        HT[i].weight=0;
        HT[i].parent=0;
        HT[i].lchild=0;
        HT[i].rchild=0;
    }
    for(i=n+1;i<=m;i++)//建立哈夫曼树
    {
        Select(HT,i-1,&p1,&p2);
        HT[p1].parent=i;HT[p2].parent=i;
        HT[i].lchild=p1;HT[i].rchild=p2;
        HT[i].weight=HT[p1].weight+HT[p2].weight;
    }
    //从叶子到根逆向求每个字符的哈夫曼编码
    HC=(HuffmanCode)malloc((n+1)*sizeof(char *));
    cd=(char *)malloc(n*sizeof(char));
    cd[n-1]='\0';
    for(i=1;i<=n;i++)
    {
        start =n-1;
        for(c=i,f=HT[i].parent;f!=0;c=f,f=HT[f].parent)
        {
            if(HT[f].lchild==c)
                cd[--start]='0';
            else
                cd[--start]='1';
        }
        HC[i]=(char *)malloc((n-start)*sizeof(char));
        strcpy(HC[i],&cd[start]);
    }
    free(cd);
}
int main()
{
    char code[100],h[100],hl[100];
    int n,i,j,k,l;
    ifstream input_file; 
    ofstream output_file;
    FILE *fp1,*fp2,*fp3,*fp4,*fp5;
    char choice,str[100];
    HuffmanTree HT;
    HuffmanCode HC;
    cout<<"            哈夫曼编码器\n";
    while(choice!='Q'&&choice!='q')            //当choice的值不为q且不为Q时循环
    {
    
        cout<<"功能: "<<"I(初始化)"<<""<<"E(编码)"<<""<<"D(译码)"<<""<<"P(打印)"<<""<<"Q(退出)\n";
        cout<<"请输入您要选择的功能:";
        cin>>choice;
        if(choice=='I'||choice=='i')              //初始化赫夫曼树
        {
            cout<<"请输入字符个数:";
            cin>>n;
            HuffmanCoding(HT,HC,n);
            for(i=1;i<=n;++i)
            {
                cout<<HT[i].ch<<":"<<HC[i]<<endl;
                
            }
            fp1=fopen("hfmTree.txt","w");
            for(i=1;i<=n;++i)
            {
                fprintf(fp1,"(%c %s)\n",HT[i].ch,HC[i]);

            }
          fclose(fp1);
            cout<<"赫夫曼树已经创建完毕,并且已经放入hfmTree.txt文件中!"<<endl;
        }
        else if(choice=='E'||choice=='e')           //进行编码,并将字符放入ToBeTran.txt,码值放入CodeFile.txt中
        {
            printf("请输入字符:");
            gets(str);
            fp2=fopen("ToBeTran.txt","w");
            fprintf(fp2,"%s",str);
            fclose(fp2);
            fp3=fopen("CodeFile.txt","w");
            for(i=0;i<strlen(str);i++){
                for(j=1;j<=n;++j)
                {
                    if(HT[j].ch==str[i])
                    {
                        fprintf(fp3,"%s",HC[j]);
                        break;
                    }
                }
            }
            fclose(fp3);
            cout<<"\n";
            fp4=fopen("CodeFile.txt","r"); 
            char H1;//从CodeFile.txt中读入编码,输出在终端
            cout<<"编码值为:\n";
            while(!feof(fp4))
            {
                H1=fgetc(fp4);
                cout<<H1;
            }
            fclose(fp4);
            cout<<"\n编码完毕,并且已经存入CodeFile.txt文件!\n";
        }
       else if(choice=='D'||choice=='d')     //读入CodeFile.txt中的编码进行译码,将译出来的字符放入Textfile.txt中
        {
            input_file.open("CodeFile.txt");
            if(!input_file){
                cout<<"can't open file!"<<endl;
                return 1;
            }
            input_file>>h;
            input_file.close();
            output_file.open("Textfile.txt");
            if(!output_file)
            {
                cout<<"can't open file!"<<endl;
                return 1;
            }
            k=0;
            while(h[k]!='\0')           //先用编码中的前几个和字符的编码相比较,然后往后移
            {
                for(i=1;i<=n;i++){
                    l=k;
                    for(j=0;j<strlen(HC[i]);j++,l++)
                    {
                        hl[j]=h[l];
                    }
                    hl[j]='\0';
                    if(strcmp(HC[i],hl)==0)
                    {
                        output_file<<HT[i].ch;
                        k=k+strlen(HC[i]);
                        break;
                    }
                }
            }
            output_file.close();
            input_file.open("Textfile.txt");

            if(!input_file){
                cout<<"can't open file!"<<endl;
                return 1;
            }
        //    input_file>>h;
            input_file.getline(h,100);//获取文件里的一行
            cout<<"译码结果为:";
           printf("%s\n",h);
            input_file.close();
            cout<<"译码结果已存入Textfile.txt中\n";
        }
       else if(choice=='P'||choice=='p')//每行50个代码
        {
            char a[num];
            fp4=fopen("CodeFile.txt","r"); 
            fgets(a,num,fp4);
            cout<<"打印代码文件:"<<endl;
            int l=strlen(a);
            for(int j=0;j<l;j++)
            {
                cout<<a[j];
                if((j+1)%50==0)
                    cout<<endl;
            }
            fclose(fp4);
            fp5=fopen("CodePrint.txt","w");
            for(int k=0;k<l;k++)
            {
                fprintf(fp5,"%c",a[k]);
                if((k+1)%50==0)
                {
                    fprintf(fp5,"\n");
                }
            }
            cout<<"\n该字符形式已存入CodePrint.txt中\n";
            fclose(fp5);
        }
        else if(choice=='Q'||choice=='q')            //退出程序
        { 
            exit(0);
        }
        
        else               //如果选了选项之外的就让用户重新选择
        {
            cout<<"您没有输入正确的步骤,请重新输入!"<<endl;
        }
        cout<<endl;
    }
    return 0;
}

用上的几个文本需要自己新建。

转载于:https://www.cnblogs.com/wuhenxiansen/p/10390400.html

猜你喜欢

转载自blog.csdn.net/weixin_30496431/article/details/94951284