ACWING149. 荷马史诗(多叉哈夫曼树)

追逐影子的人,自己就是影子。 ——荷马

达达最近迷上了文学。

她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。

但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,达达想通过一种编码方式使得它变得短一些。

一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。

达达想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:

对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。

现在达达想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。

在确保总长度最小的情况下,达达还想知道最长的 si 的最短长度是多少?

一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。

字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1…t]。

其中,m 是字符串 Str2 的长度,Str2[1…t] 表示 Str2 的前 t 个字符组成的字符串。

注意:请使用64位整数进行输入输出、储存和计算。

输入格式
输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

第2~n+1 行:第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

输出格式
输出文件包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。

第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

数据范围
2≤n≤100000,
2≤k≤9
1≤wi≤1012
输入样例:
4 2
1
1
2
2
输出样例:
12
2

思路:
本质是多叉的哈夫曼树。最短的最长编码长度对应这棵哈夫曼树的合并次数,总编码数位非叶子节点的权值和。

需要注意的是,每次合并要减少k-1个点,并且合并完后要剩下一个点。这需要(n-1)%(k-1)=0,如果不为0,就需要手动加权值为0的叶子节点。

#include <cstdio>
#include <cstring>
#include <algorithm>
#include <queue>

using namespace std;

typedef long long ll;
priority_queue<pair<ll,ll> >Q;

int main()
{
    int n,k;scanf("%d%d",&n,&k);
    for(int i = 1;i <= n;i++)
    {
        ll x;scanf("%lld",&x);
        Q.push(make_pair(-x,0));
    }
    
    while((n - 1) % (k - 1))
    {
        n++;
        Q.push(make_pair(0,0));
    }
    
    ll ans = 0;
    while(Q.size() != 1)
    {
        ll num1 = 0,num2 = 0;
        for(int i = 0;i < k;i++)
        {
            pair<ll,ll>now = Q.top();Q.pop();
            num1 += now.first;num2 = min(num2,now.second);
        }
        Q.push(make_pair(num1,num2 - 1));
        ans += -num1;
    }
    printf("%lld\n%lld\n",ans,-Q.top().second);
    return 0;
}


发布了756 篇原创文章 · 获赞 27 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/tomjobs/article/details/104538845
今日推荐