bzoj 1264 基因匹配

Written with StackEdit.

Description

卡卡昨天晚上做梦梦见他和可可来到了另外一个星球，这个星球上生物的\(DNA\)序列由无数种碱基排列而成（地球上只有\(4\)种），而更奇怪的是，组成\(DNA\)序列的每一种碱基在该序列中正好出现\(5\)次！这样如果一个\(DNA\)序列有\(N\)种不同的碱基构成，那么它的长度一定是\(5N\)。

任务:编写一个程序:

从输入文件中读入两个等长的\(DNA\)序列；
计算它们的最长公共子序列长度；
向输出文件打印你得到的结果。

Input

输入文件中第一行有一个整数\(N\)，表示这个星球上某种生物使用了N种不同的碱基，以后将它们编号为\(1…N\)的整数。

以下还有两行，每行描述一个\(DNA\)序列：包含\(5N\)个\(1…N\)的整数，且每一个整数在对应的序列中正好出现\(5\)次。

Output

输出文件中只有一个整数，即两个\(DNA\)序列的最长公共子序列长度。

Sample Input

2
1 1 2 2 1 1 2 1 2 2
1 2 2 2 1 1 2 2 1 1

Sample Output

HINT

[数据约束和评分方法]

\(60\%\)的测试数据中：\(1<=N <= 1000.\)
\(100\%\)的测试数据中：\(1<=N <= 20000.\)

Solution

朴素的\(O(n^2)dp\)只能解决\(60\%\)的部分.
注意到一个关键性质,每个数在每个序列中都恰好出现\(5\)次.
类似于给两个排列求\(LCS\),我们可以记录下每个数字在第一个序列\(a\)中从前往后的\(5\)个位置.
再处理第二个序列\(b\),此时我们处理当前数\(b[i]\)在第一个序列中每个出现的位置\(pos\).有\(a[pos]=b[i].\)
那么根据朴素\(dp\)的思路,定义\(f[i]\)为只用\(a\)序列的前\(i\)个数的\(LCS\)长度.
此时就可以完成更新\(f[pos]=max(f[1\)~\(pos-1])+1\).利用树状数组维护最大值进行优化.
特别注意:每个\(b[i]\)对应了\(5\)个\(pos\),而我们处理它们的时候应该从后往前倒序处理,否则先更新的会对后面的造成影响,破坏无后效性(类似01背包).

#include<bits/stdc++.h>
#define lowbit(x) x&(-x)
using namespace std;
typedef long long LoveLive;
inline int read()
{
    int out=0,fh=1;
    char jp=getchar();
    while ((jp>'9'||jp<'0')&&jp!='-')
        jp=getchar();
    if (jp=='-')
        {
            fh=-1;
            jp=getchar();
        }
    while (jp>='0'&&jp<='9')
        {
            out=out*10+jp-'0';
            jp=getchar();
        }
    return out*fh;
}
const int MAXN=2e5+10;
int ta[MAXN];
int va[MAXN][10];
int bit[MAXN];
int n;
inline void upd(int x,int c)
{
    for(;x<=n;x+=lowbit(x))
        bit[x]=max(bit[x],c);
}
inline int query(int x)
{
    int res=0;
    for(;x;x-=lowbit(x))
        res=max(res,bit[x]);
    return res;
}
int main()
{
    n=read();
    n*=5;
    for(int i=1;i<=n;++i)
        {
            int t=read();
            va[t][++ta[t]]=i;
        }
    for(int i=1;i<=n;++i)
        {
            int t=read();
            for(int j=5;j>=1;--j)//值得细细斟酌
                {
                    int pos=va[t][j];
                    int mx=query(pos-1)+1;
                    upd(pos,mx);
                }
        }
    int ans=query(n);
    printf("%d\n",ans);
    return 0;
}