ccf 201612-4 压缩编码

201612-4
试题名称：压缩编码
时间限制： 3.0s
内存限制： 256.0MB
问题描述：
问题描述
　　给定一段文字，已知单词a1, a2, …, an出现的频率分别t1, t2, …, tn。可以用01串给这些单词编码，即将每个单词与一个01串对应，使得任何一个单词的编码（对应的01串）不是另一个单词编码的前缀，这种编码称为前缀码。
　　使用前缀码编码一段文字是指将这段文字中的每个单词依次对应到其编码。一段文字经过前缀编码后的长度为：
　　L=a1的编码长度×t1+a2的编码长度×t2+…+ an的编码长度×tn。
　　定义一个前缀编码为字典序编码，指对于1 ≤ i < n，ai的编码（对应的01串）的字典序在ai+1编码之前，即a1, a2, …, an的编码是按字典序升序排列的。
　　例如，文字E A E C D E B C C E C B D B E中， 5个单词A、B、C、D、E出现的频率分别为1, 3, 4, 2, 5，则一种可行的编码方案是A:000, B:001, C:01, D:10, E:11，对应的编码后的01串为1100011011011001010111010011000111，对应的长度L为3×1+3×3+2×4+2×2+2×5=34。
　　在这个例子中，如果使用哈夫曼(Huffman)编码，对应的编码方案是A:000, B:01, C:10, D:001, E:11，虽然最终文字编码后的总长度只有33，但是这个编码不满足字典序编码的性质，比如C的编码的字典序不在D的编码之前。
　　在这个例子中，有些人可能会想的另一个字典序编码是A:000, B:001, C:010, D:011, E:1，编码后的文字长度为35。
　　请找出一个字典序编码，使得文字经过编码后的长度L最小。在输出时，你只需要输出最小的长度L，而不需要输出具体的方案。在上面的例子中，最小的长度L为34。
输入格式
　　输入的第一行包含一个整数n，表示单词的数量。
　　第二行包含n个整数，用空格分隔，分别表示a1, a2, …, an出现的频率，即t1, t2, …, tn。请注意a1, a2, …, an具体是什么单词并不影响本题的解，所以没有输入a1, a2, …, an。
输出格式
　　输出一个整数，表示文字经过编码后的长度L的最小值。
样例输入
5
1 3 4 2 5
样例输出
34
样例说明
　　这个样例就是问题描述中的例子。如果你得到了35，说明你算得有问题，请自行检查自己的算法而不要怀疑是样例输出写错了。
评测用例规模与约定
　　对于30%的评测用例，1 ≤ n ≤ 10，1 ≤ ti ≤ 20；
　　对于60%的评测用例，1 ≤ n ≤ 100，1 ≤ ti ≤ 100；
　　对于100%的评测用例，1 ≤ n ≤ 1000，1 ≤ ti ≤ 10000。

说明：这道题虽然是每个权值乘以深度，但是细细想来，要满足字典序，类似哈夫曼树那样建树即可，就将相邻的节点生成一个新节点，每次合并一次，加一下l到r的和，就是l到r的节点形成了一棵树的权值和，用求和代替乘积，但是和乘积是一样的。
这样问题就变成了动态规划经典问题——取石子问题。
设dp[i][j]表示第i到第j堆石子合并的最优值，sum[i][j]表示第i到第j堆石子的总数量。那么就有状态转移公式：
1、dp[i][j]=0 (i==j)
2、dp[i][j]=min(dp[i][k]+dp[k + 1][j])+sum[i][j] (i!=j)
此时算法复杂为O(n^3)。
可以用平行四边形优化降为O(n^2)。

要用平行四边形优化则要证明w[i][j],dp[i][j]是否满足四边形不等式
w[a,c]+w[b,d]<=w[b,c]+wa,d 就称其满足凸四边形不等式
或打表观察w[i][j+1]-w[i][j]关于i的表达式，如果关于i递减，则w满足凸四边形不等式
如果一个函数w[i][j]，满足 w[i’][j]<=w[i][j’] i<=i’<=j<=j’ 则称w关于区间包含关系单调
如果w同时满足四边形不等式和区间单调关系，则dp也满足四边形不等式

通常的动态规划的复杂度是O(n^3)，四边形不等式程序中跑一遍i只会跑一遍j，所以可以优化到O(n^2)

详细证明:
http://baike.baidu.com/view/1985058.htm?fr=aladdin
http://blog.csdn.net/lmyclever/article/details/6677683
2s：

#include<bits/stdc++.h>
using namespace std;
typedef long long LL;
const int inf = 0x3f3f3f3f;
const int N = 1005;

int a[N];
int dp[N][N];
int sum[N];

int main()
{
    int n;
    scanf("%d",&n);
    sum[0] = 0;
    memset(dp,inf,sizeof(dp));
    for(int i = 1;i <= n;++i)
    {
        scanf("%d",&a[i]);
        sum[i] = sum[i - 1] + a[i];
        dp[i][i] = 0;
    }
    for(int i = 1;i <= n;++i)
    {
        for(int j = 1;j + i <= n;++j)
        {
            if(dp[j][i + j] == inf){
                for(int k = j;k < i + j;++k)
                {
                    dp[j][i + j] = min(dp[j][i + j],dp[j][k] + dp[k + 1][i + j] + sum[i + j] - sum[j - 1]);
                }
            }
        }
    }
    printf("%d\n",dp[1][n]);
    return 0;
}

优化后31ms:

#include<bits/stdc++.h>
using namespace std;
typedef long long LL;
const int inf = 0x3f3f3f3f;
const int N = 1005;

int a[N];
int dp[N][N];
int sum[N];
int s[N][N];

int main()
{
    int n;
    scanf("%d",&n);
    sum[0] = 0;
    memset(dp,inf,sizeof(dp));
    for(int i = 1;i <= n;++i)
    {
        scanf("%d",&a[i]);
        sum[i] = sum[i - 1] + a[i];
        dp[i][i] = 0;
        s[i][i] = i;
    }
    for(int i = 1;i <= n;++i)
    {
        for(int j = 1;j + i <= n;++j)
        {
            if(dp[j][i + j] == inf){
                for(int k = s[j][i + j - 1];k <= s[j + 1][i + j];++k)
                {
                    int x = dp[j][k] + dp[k + 1][i + j] + sum[i + j] - sum[j - 1];
                    if(dp[j][i + j] > x){
                        dp[j][i + j] = x;
                        s[j][i + j] = k;
                    }
                }
            }
        }
    }
    printf("%d\n",dp[1][n]);
    return 0;
}

ccf 201612-4 压缩编码

猜你喜欢