哈夫曼编码算法的实现(c语言版本数据与结构)

哈夫曼编码算法的实现

1、需求分析

实现一个哈夫曼编码系统,系统包括以下功能:

(1) 字符信息统计:读取待编码的源文件SourceFile.txt,统计出现的字符及其频率。

(2) 建立哈夫曼树:根据统计结果建立哈夫曼树。

(3) 建立哈夫曼码表:利用得到的哈夫曼树,将各字符对应的编码表保存在文件Code.txt中。

(4) 对源文件进行编码:根据哈夫曼码表,将SourceFile.txt中的字符转换成相应的编码文件ResultFile.txt。

(1) 字符信息统计:

假设源文件SourceFile.txt中的字符只有大小写英文字母(同一个字母的大小写看作一个字符),则字符统计算法的实现过程可以归纳为:先定义一个含有26个元素的整形数组,用来存储各个字母出现的次数,最后还要排除其中出现次数为0的数组元素。

(2) 建立哈夫曼树:参考教材算法5.10,补充函数Select的实现。

(3) 建立哈夫曼码表:参考教材算法5.11,将编译表HC中的内容写到文件Code.txt中。

(4) 对源文件进行编码:依次读入文件SourceFile.txt中的字符 c,在编码表 HC 中找到此字符,将字符c转换为编码表中存放的编码串,写入编码文件ResultFile.txt中,直到所有的字符处理完毕为止。

选做内容:
完成译码功能:对任意一个给定的由01组成的文件,根据哈夫曼码表翻译成由字符组成的源文件。

提示:
对文件进行译码的过程必须借助于哈夫曼树。具体过程是:依次读入文件的二进制码,从哈夫曼树的根结点(即HT[m])出发,若当前读入0,则走向左孩子,否则走向右孩子。一旦到达某一叶子HT[i]时便译出相应的字符编码HC[i]。然后重新从根出发继续译码,直至文件结束。

二、概要设计

2.1、所用数据结构的定义及其相关说明(相关结构体或类的定义及其含义)

在这里插入图片描述

2.2、各子程序(函数和过程)的功能

1//字符信息统计:读取待编码的源文件SourceFile.txt,统计出现的字符及其频率。
		void Count()
    
2//选择HT中双亲域为0的权值最小的两个结点
void Select(HuffmanTree HT,int i,int &s1,int &s2)

3//选择HT中双亲域为0的权值最小的两个结点
void Select(HuffmanTree HT,int i,int &s1,int &s2)

4//建立哈夫曼树:根据统计结果建立哈夫曼树。
//算法5.10  根据统计结果建立Huffman树
void CreatHuffmanTree(HuffmanTree &HT,int cou[])

5//算法5.11  根据统计结果对各字符进行编码,并保存在Code.txt中
void CreatHuffmanCode(HuffmanTree HT,HuffmanCode &HC)

6//对SourceFile.txt进行编码,并保存在ResultFile.txt中
void Code(HuffmanTree &HT,HuffmanCode &HC)

7//菜单选项
void memu(void)

8//函数
int main(void) 

三、详细设计

3.1、数据类型定义

3.1.1.1、 字符信息统计:读取待编码的源文件SourceFile.txt,统计出现的字符及其频率

void  Count()    
{
	FILE *fp;
	char i;
	char word;
	char letter[27]={' ','a','b','c','d','e','f','g','h','i','j','k','l','m','n','o',
		                              'p','q','r','s','t','u','v','w','x','y','z'};
    //计算输入的字母的个数
    if((fp=fopen("character.txt","r"))==NULL)
	 {  
        printf("can not open the file character.txt");  
        exit(0);  
    }  
    while((word=fgetc(fp))!=EOF)
	{
		if (word>='A'&&word<='Z')
			{
				word=word+32;
			}
		    i=word-96;
			cou[i]++;
	}
    fclose(fp);
    printf("\t\tletter\t频率为\n");
	for (int j=1;j<=26;j++)
	{
		if (cou[j]!=0)
		{
			printf("\t\t%c\t%d\n",letter[j],cou[j]);
		}
	}
	printf("\n");
	printf("\t\t字符统计完成!\n");
}

3.1.2 、选择HT中双亲域为0的权值最小的两个结点

void Select(HuffmanTree HT,int i,int &s1,int &s2)
{
	//选择两个最小值,将他们的位序输出到s1,s2
    int m=0,k=0;
    for(k=1;k<=n;++k)   //得到第一个父节点为零的节点
    {
        if(0==HT[k].parent)
        {
            m=HT[k].weight;
            s1=k;
            break;
        }
    }
    for(;k<=n;++k)             //得到最小值
    {
        if(0==HT[k].parent && HT[k].weight<m)
        {
            m=HT[k].weight;
            s1=k;
        }
    }
    for(k=1;k<=n;++k)      //得到第二个父节点为零的节点
    {
        if(k!=s1 && 0==HT[k].parent)
        {
            m=HT[k].weight;
            s2=k;
            break;
        }
    }
    for(;k<=n;++k)           //求得次小元
    {
        if(0==HT[k].parent && k!=s1 && HT[k].weight<m)
        {
            m=HT[k].weight;
            s2=k;
        }
    }
}//Select

3.1.3、建立哈夫曼树:根据统计结果建立哈夫曼树。

//算法5.10  根据统计结果建立Huffman树
void CreatHuffmanTree(HuffmanTree &HT,int cou[])
{	
	if(n<=1) return;
	int m=2*n-1; 
	HT=new HTNode[m+1];     
	//0 号单元未用,所以需要动态分配m+1个单元,HT[m]表示根节点
	int s1=0,s2=0;              //

    for(int i=1;i<=m;i++)         
	//初始化HuffmanTree 将1~m单元中的双亲,左右孩子的下标初始化为0
	{
		HT[i].lchild=0;
		HT[i].rchild=0;
		HT[i].parent=0;
	}

	for(i=1;i<=n;i++)               //输入叶节点的权值
		HT[i].weight=cou[i-1];      
	for(i=n+1;i<=m;i++)             
	{
		Select(HT,i,s1,s2);        
		//选择HT中两个双亲域为0且权值最小的两个节点的序号s1和s2
		HT[s1].parent=i;    HT[s2].parent=i;    
		//标记其双亲结点为HT[i]
		HT[i].lchild=s1;    HT[i].rchild=s2;       
		//HT[s1]和HT[s2]作为HT[i]的左右孩子
		HT[i].weight=HT[s1].weight+HT[s2].weight;  
		//HT[i]的权值为左右孩子权值之和
	}
	printf("\t\thuffmantree构造完成\n");
}

3.1.4、算法5.11 根据统计结果对各字符进行编码,并保存在Code.txt中

void CreatHuffmanCode(HuffmanTree HT,HuffmanCode &HC)
{   
	int start;
	char *cd;
	HC=new char*[n+1];
	cd=new char[n];
	cd[n-1]='\0';
	int i,c,f;
	for (i=1;i<=n;++i)
	{
	start=n-1;
	c=i;f=HT[i].parent;
	while(f!=0){
		--start;
		if (HT[f].lchild==c)
			cd[start]='0';
		else cd[start]='1';
		c=f;
		f=HT[f].parent;
	}
	HC[i]=new char[n-start];
	strcpy(HC[i],&cd[start]);
	}
    delete cd;
	printf("\t\tHuffmanCode创建完毕\n");
}
//对SourceFile.txt进行编码,并保存在ResultFile.txt中
void Code(HuffmanTree &HT,HuffmanCode &HC)
{
	 FILE *fp;
	 char word;
	 int i;
	 if((fp=fopen("character.txt","r"))==NULL)
	 {  
        printf("can not open the file character.txt");  
        exit(0);  
    }  
	fp=fopen("character.txt","r");
	while((word=fgetc(fp))!=EOF)
	{
		if (word>='A'&&word<='Z')
			{
				word=word+32;
			}
		    i=word-96;
			cou[i]++;
	}
	if(!word)
	  printf("cannot open the file!\n");
	printf("\t\thuffman编码完成\n");
	fclose(fp);
}

3.1.5、菜单选项

void memu(void)
{
	printf("\t\t||************ 欢迎使用学生信息管理系统!****************||\n");
	printf("\t\t||**name:yuan number:1xxxxxxxxx              *******||\n");
	printf("\t\t||   *********************************              ||\n");
    printf("\t\t||   *                 功能菜单             *         ||\n");
    printf("\t\t||   ***********************************************||\n");
	printf("\t\t||   1.字符信息统计,统计出现的字符及其频率                ||\n");
	printf("\t\t||   2.建立哈夫曼树:根据统计结果建立哈夫曼树              ||\n");
	printf("\t\t||   3.建立哈夫曼码表将各字符对应的编码表保存在Code.txt     ||\n");
	printf("\t\t||   4.对源文件进行编码,将字符转换成相应的编码文件           ||\n");
	printf("\t\t||   5.退出系统                                          ||\n");
	printf("\t\t||   ****************************************************||\n");
	printf("\t\t>>>请选择您需要的服务(1--5):");
}

四、测试分析

实验结果:

4.1、读入文本文档中的数据,并进行统计。

在这里插入图片描述
ourceFile.txt文件内容为

在这里插入图片描述

4.2、建立哈夫曼树:根据统计结果建立哈夫曼树。

在这里插入图片描述

4.3、建立哈夫曼码表:利用得到的哈夫曼树,将各字符对应的编码表保存在文件Code.txt中。

在这里插入图片描述

字符对应的编码表保存在文件Code.txt,结果为:
在这里插入图片描述

4.4、 对源文件进行编码:根据哈夫曼码表,将SourceFile.txt中的字符转换成相应的编码文件

在这里插入图片描述
根据哈夫曼码表,将SourceFile.txt中的字符转换成相应的编码文件ResultFile.txt,结果为:
在这里插入图片描述

五、源程序清单

//头文件
#include "stdio.h"
#include "stdlib.h"
#include "string.h"
int cou[100];

//哈夫曼树的结构体
typedef struct
{
	int weight; //结点的
	int parent,lchild,rchild;

}HTNode,*HuffmanTree;

typedef char **HuffmanCode;

int n=2;

//字符信息统计:读取待编码的源文件SourceFile.txt,统计出现的字符及其频率。
void  Count()    
{
	FILE *fp;
	char i;
	char word;
	char letter[27]={' ','a','b','c','d','e','f','g','h','i','j','k','l','m','n','o',
		                              'p','q','r','s','t','u','v','w','x','y','z'};
    //计算输入的字母的个数
    if((fp=fopen("character.txt","r"))==NULL)
	 {  
        printf("can not open the file character.txt");  
        exit(0);  
    }  
    while((word=fgetc(fp))!=EOF)
	{
		
		if (word>='A'&&word<='Z')
			{
				word=word+32;
			}
		    i=word-96;
			cou[i]++;
	}
    fclose(fp);
    printf("\t\tletter\t频率为\n");
	for (int j=1;j<=26;j++)
	{
		if (cou[j]!=0)
		{
			printf("\t\t%c\t%d\n",letter[j],cou[j]);
		}
	}
	printf("\n");
	printf("\t\t字符统计完成!\n");
	
}

//选择HT中双亲域为0的权值最小的两个结点
void Select(HuffmanTree HT,int i,int &s1,int &s2)
{
	//选择两个最小值,将他们的位序输出到s1,s2
    int m=0,k=0;
	
    for(k=1;k<=n;++k)   //得到第一个父节点为零的节点
    {
        if(0==HT[k].parent)
        {
            m=HT[k].weight;
            s1=k;
            break;
        }
    }
	
    for(;k<=n;++k)             //得到最小值
    {
        if(0==HT[k].parent && HT[k].weight<m)
        {
            m=HT[k].weight;
            s1=k;
        }
    }
	
    for(k=1;k<=n;++k)      //得到第二个父节点为零的节点
    {
        if(k!=s1 && 0==HT[k].parent)
        {
            m=HT[k].weight;
            s2=k;
            break;
        }
    }
	
    for(;k<=n;++k)           //求得次小元
    {
        if(0==HT[k].parent && k!=s1 && HT[k].weight<m)
        {
            m=HT[k].weight;
            s2=k;
        }
    }
}//Select
//建立哈夫曼树:根据统计结果建立哈夫曼树。
//算法5.10  根据统计结果建立Huffman树
void CreatHuffmanTree(HuffmanTree &HT,int cou[])
{	
	if(n<=1) return;
	int m=2*n-1; 
	HT=new HTNode[m+1];     
	//0 号单元未用,所以需要动态分配m+1个单元,HT[m]表示根节点
	int s1=0,s2=0;              //

    for(int i=1;i<=m;i++)         
	//初始化HuffmanTree 将1~m单元中的双亲,左右孩子的下标初始化为0
	{
		HT[i].lchild=0;
		HT[i].rchild=0;
		HT[i].parent=0;
	}

	for(i=1;i<=n;i++)               //输入叶节点的权值
		HT[i].weight=cou[i-1];      
	for(i=n+1;i<=m;i++)             
	{
		Select(HT,i,s1,s2);        
		//选择HT中两个双亲域为0且权值最小的两个节点的序号s1和s2
		HT[s1].parent=i;    HT[s2].parent=i;    
		//标记其双亲结点为HT[i]
		HT[i].lchild=s1;    HT[i].rchild=s2;       
		//HT[s1]和HT[s2]作为HT[i]的左右孩子
		HT[i].weight=HT[s1].weight+HT[s2].weight;  
		//HT[i]的权值为左右孩子权值之和
	}
	printf("\t\thuffmantree构造完成\n");
}

//算法5.11  根据统计结果对各字符进行编码,并保存在Code.txt中
void CreatHuffmanCode(HuffmanTree HT,HuffmanCode &HC)
{   
	int start;
	char *cd;
	HC=new char*[n+1];
	cd=new char[n];
	cd[n-1]='\0';
	int i,c,f;
	for (i=1;i<=n;++i)
	{
	start=n-1;
	c=i;f=HT[i].parent;
	while(f!=0){
		--start;
		if (HT[f].lchild==c)
			cd[start]='0';
		else cd[start]='1';
		c=f;
		f=HT[f].parent;
	}
	HC[i]=new char[n-start];
	strcpy(HC[i],&cd[start]);
	}
    delete cd;
	printf("\t\tHuffmanCode创建完毕\n");
}
//对SourceFile.txt进行编码,并保存在ResultFile.txt中
void Code(HuffmanTree &HT,HuffmanCode &HC)
{
	 FILE *fp;
	 char word;
	 int i;
	 if((fp=fopen("character.txt","r"))==NULL)
	 {  
        printf("can not open the file character.txt");  
        exit(0);  
    }  
	fp=fopen("character.txt","r");
	while((word=fgetc(fp))!=EOF)
	{
		if (word>='A'&&word<='Z')
			{
				word=word+32;
			}
		    i=word-96;
			cou[i]++;
	}
	if(!word)
	  printf("cannot open the file!\n");
	else
	{
	
	}
	printf("\t\thuffman编码完成\n");
	fclose(fp);
}
//菜单选项
void memu(void)
{
	printf("\t\t||************ 欢迎使用学生信息管理系统!****************||\n");
	printf("\t\t||**name:伍思源 number:182034490136    电信18-1   *******||\n");
	printf("\t\t||   *********************************                   ||\n");
    printf("\t\t||   *                 功能菜单             *            ||\n");
    printf("\t\t||   ****************************************************||\n");
	printf("\t\t||   1.字符信息统计,统计出现的字符及其频率               ||\n");
	printf("\t\t||   2.建立哈夫曼树:根据统计结果建立哈夫曼树            ||\n");
	printf("\t\t||   3.建立哈夫曼码表将各字符对应的编码表保存在Code.txt  ||\n");
	printf("\t\t||   4.对源文件进行编码,将字符转换成相应的编码文件       ||\n");
	printf("\t\t||   5.退出系统                                          ||\n");
	printf("\t\t||   ****************************************************||\n");
	printf("\t\t>>>请选择您需要的服务(1--5):");
}
int main(void)
{
	HuffmanTree ht;
    HuffmanCode hc;
	int no;
	while(1)
	{
		memu();
		scanf("%d",&no);
		printf("\n");
		switch(no)
		{
            //字符信息统计,统计出现的字符及其频率 
			case 1:
				   Count();
				   break;
			//建立哈夫曼树:根据统计结果建立哈夫曼树
			case 2:
                    CreatHuffmanTree(ht,cou);
		    		break;
			//建立哈夫曼码表将各字符对应的编码表保存在Code.txt
			case 3:
				   CreatHuffmanCode(ht,hc);
					break;
			//对源文件进行编码,将字符转换成相应的编码文件
			case 4:
                   Code(ht,hc);
				  break;
			 //退出系统
			case 5:
				printf("\t\t\t退出系统\n");
				 return 0;
		}
		printf("\n");
	}
}

六、用户使用手册

用户执行代码后,主菜单会显示5个功能,分别为:

(1) 字符信息统计:读取待编码的源文件SourceFile.txt,统计出现的字符及其频率。

(2) 建立哈夫曼树:根据统计结果建立哈夫曼树。

(3) 建立哈夫曼码表:利用得到的哈夫曼树,将各字符对应的编码表保存在文件Code.txt中。

(4) 对源文件进行编码:根据哈夫曼码表,将SourceFile.txt中的字符转换成相应的编码文件ResultFile.txt。

(5) //退出系统

首先,用户根据提示选择功能(1): 读取待编码的源文件SourceFile.txt,统计出现的字符及其频率

若选择功能(2):用户可以根据自己的需求建立哈夫曼树:根据统计结果建立哈夫曼树

若选择功能(3):建立哈夫曼码表:利用得到的哈夫曼树,将各字符对应的编码表保存在文件Code.txt中。

若选择功能(4):源文件进行编码:根据哈夫曼码表,将SourceFile.txt中的字符转换成相应的编码文件ResultFile.txt

若选择功能(5):根据学号进行折半查找,用非递归算法实现,则根据提示输入学生的学号,就可以显示出结果

猜你喜欢

转载自blog.csdn.net/weixin_44908159/article/details/107245035