day9——数据结构实验之二叉树六:哈夫曼编码(里面用到的思想很重要哦!!!)

数据结构实验之二叉树六:哈夫曼编码

Time Limit: 1000 ms Memory Limit: 65536 KiB

Problem Description

字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

Input

 输入数据有多组,每组数据一行,表示要编码的字符串。

Output

 对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。

Sample Input

AAAAABCD
THE_CAT_IN_THE_HAT

Sample Output

64 13 4.9
144 51 2.8

#include<stdio.h>
#include<string.h>

void sort(int a[], int l, int r)
{
    int i = l, j = r, key = a[l];
    if(l > r)
    {
        return ;
    }

    while(i < j)
    {
        while(i < j && a[j] >= key)
        {
            j--;
        }

        a[i] = a[j];

        while(i < j && a[i] <= key)
        {
            i++;
        }

        a[j] = a[i];
    }

    a[i] = key;
    sort(a, l, i - 1);
    sort(a, i + 1, r);
}

int main(void)
{
    int i, t[1000], q[1000];
    char s[5000];

    while(~scanf("%s", s))
    {
        int top = 0, rear = 0;
        memset(t, 0, sizeof(t));
        memset(q, 0, sizeof(q));

        int len = strlen(s);
        int sum1 = 8 * len;//ASCII一个字符占8个字节
        int sum2 = 0;

        for(i = 0; i < len; i++)
        {
            t[s[i] - '0']++;
        }

        for(i = 0; i < 256; i++)
        {
            if(t[i] != 0)
            {
                q[top++] = t[i];
            }
        }

        sort(q, 0, top - 1);
        while(top != rear)
        {
            int x1 = q[rear++];
            if(top != rear)
            {
                int x2 = q[rear++];
                sum2 += x1 + x2;
                q[top++] = x1 + x2;
                sort(q, rear, top - 1);
            }
        }

        printf("%d %d %.1lf\n", sum1, sum2, (sum1 * 1.0) / sum2);
    }

    return 0;
}
 

猜你喜欢

转载自blog.csdn.net/Eider1998/article/details/82152895
今日推荐