【BZOJ5496】[十二省联考2019]字符串问题(后缀树)

【BZOJ5496】[十二省联考2019]字符串问题(后缀树)

题面

BZOJ
洛谷

题解

首先显然可以把具有支配关系的串从\(A\)\(B\)连一条有向边,如果\(B_i\)\(A_j\)的前缀,就从\(B\)连一条边到\(A\)。这样子问题就转化成了要求解这个二分图的最长路经,有环答案就是\(-1\)
然后显然就是要找个什么东西出来优化连边是吧。。。
现在唯一要处理的东西就是要找到个啥玩意,来优化这个满足前缀条件的连边。
假装我们有一个所有后缀都被插进去的\(Trie\)树,那么对于每一个\(B\)只需要找到其对应的节点,然后它子树中的每一个\(A\)都会被他连过去,这样子似乎就达成了优化连边,即每一个\(B\)连向这个节点,然后这样节点连向在这个节点终止的\(A\)
这个复杂度显然是爆炸的,所以我们可以直接建立后缀树,这样子节点数就被优化到了\(O(n)\)级别。
于是问题又出现了,在后缀树上的一个节点表示的长度是一段区间,假如一个节点上又挂了\(A\),又挂了\(B\)就会出锅。(虽然不管这个也有\(80\)分了)
那行啊,我们来拆个点,每个树上节点拆两个,一个\(u\)负责挂好所有儿子,另外一个\(v\)负责挂好所有在这个点的\(A\),然后所有的\(A\)按照长度从小往大挂成一条链。然后\(v\)指向\(u\),这样子任何一个\(B\)对应的一定是一段后缀\(A\),所以直接后缀优化连边连向这条链,然后再连向\(u\)表示指向所有的儿子。
这样子还是很麻烦,实际上有一个更加优秀的做法,就是对于一个点如果挂了多个串,那么就按照每个串长把这个点强行拆掉就行了(虽然本质上就是挂了一条链)。
于是只需要求解最长路就行了,而且还是树上的最长链,只需要按照拓扑序做就行了,即使有环也可以在这个过程中处理掉。

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<vector>
#include<queue>
using namespace std;
#define ll long long
#define MAX 800800
#define pb push_back
inline int read()
{
    int x=0;bool t=false;char ch=getchar();
    while((ch<'0'||ch>'9')&&ch!='-')ch=getchar();
    if(ch=='-')t=true,ch=getchar();
    while(ch<='9'&&ch>='0')x=x*10+ch-48,ch=getchar();
    return t?-x:x;
}
vector<int> E[MAX],W[MAX],str[MAX];
char ch[MAX];int Len;
int fa[20][MAX],pos[MAX],val[MAX];
struct Node{int son[26],len,ff;void clear(){memset(son,0,sizeof(son));len=ff=0;}}t[MAX];
int last=1,tot=1;
void extend(int c)
{
    int p=last,np=++tot;last=np;
    t[np].len=t[p].len+1;
    while(p&&!t[p].son[c])t[p].son[c]=np,p=t[p].ff;
    if(!p)t[np].ff=1;
    else
    {
        int q=t[p].son[c];
        if(t[q].len==t[p].len+1)t[np].ff=q;
        else
        {
            int nq=++tot;
            t[nq]=t[q];t[nq].len=t[p].len+1;
            t[q].ff=t[np].ff=nq;
            while(p&&t[p].son[c]==q)t[p].son[c]=nq,p=t[p].ff;
        }
    }
}
vector<int> ee[MAX];
void dfs(int u,int ff)
{
    fa[0][u]=ff;
    for(int i=1;i<20;++i)fa[i][u]=fa[i-1][fa[i-1][u]];
    for(int i=0,l=ee[u].size();i<l;++i)dfs(ee[u][i],u);
}
void Work()
{
    Len=strlen(ch+1);
    for(int i=Len;i;--i)extend(ch[i]-97),pos[i]=last;
    for(int i=1;i<=tot;++i)ee[t[i].ff].pb(i);
    dfs(1,0);
}
int TOT,nd[MAX],IDA[MAX],IDB[MAX],Lim[MAX],lenA[MAX];
void Add(int u,int v,int w){if(u)E[u].pb(v),W[u].pb(w);}
bool cmp(int a,int b){return lenA[a]<lenA[b];}
void Build(int u,int ff)
{
    int np=++TOT;nd[u]=np;Lim[np]=t[u].len;
    if(ff)
    {
        int lst=ff;
        for(int i=0,l=str[u].size();i<l;++i)
        {
            Add(lst,++TOT,0),val[TOT]=lenA[str[u][i]],fa[0][TOT]=lst,Lim[TOT]=lenA[str[u][i]],lst=TOT;
            IDA[str[u][i]]=TOT;
        }
        Add(lst,np,0);fa[0][np]=lst;
    }
    for(int i=0,l=ee[u].size();i<l;++i)Build(ee[u][i],np);
}
int deg[MAX];ll dis[MAX],ans;
void Topsort()
{
    for(int i=1;i<=TOT;++i)
        for(int j=0,l=E[i].size();j<l;++j)
            deg[E[i][j]]+=1;
    queue<int> Q;int QwQ=0;
    for(int i=1;i<=TOT;++i)if(!deg[i])Q.push(i);
    while(!Q.empty())
    {
        int u=Q.front();Q.pop();QwQ+=1;
        ans=max(ans,dis[u]+val[u]);
        for(int i=0,l=E[u].size();i<l;++i)
        {
            int v=E[u][i];
            dis[v]=max(dis[v],dis[u]+W[u][i]);
            if(!--deg[v])Q.push(v);
        }
    }
    if(QwQ<TOT)puts("-1");
    else printf("%lld\n",ans);
}
int main()
{
    int T=read();
    while(T--)
    {
        scanf("%s",ch+1);
        Work();
        int A=read();
        for(int i=1;i<=A;++i)
        {
            int l=read(),r=read(),len=r-l+1;
            int u=pos[l];lenA[i]=len;
            for(int i=19;~i;--i)
                if(t[fa[i][u]].len>=len)u=fa[i][u];
            str[u].pb(i);
        }
        for(int i=1;i<=tot;++i)sort(str[i].begin(),str[i].end(),cmp);
        for(int i=0;i<=tot;++i)
            for(int j=0;j<20;++j)fa[j][i]=0;
        Build(1,0);
        for(int j=1;j<20;++j)
            for(int i=1;i<=TOT;++i)
                fa[j][i]=fa[j-1][fa[j-1][i]];
        int B=read();
        for(int i=1;i<=B;++i)
        {
            int l=read(),r=read(),len=r-l+1;IDB[i]=++TOT;
            int u=nd[pos[l]];
            for(int j=19;~j;--j)
                if(Lim[fa[j][u]]>=len)u=fa[j][u];
            Add(IDB[i],u,0);
        }
        int C=read();
        while(C--)
        {
            int x=read(),y=read();
            Add(IDA[x],IDB[y],lenA[x]);
        }
        Topsort();
        for(int i=0;i<=TOT;++i)
        {
            ee[i].clear();E[i].clear();t[i].clear();
            str[i].clear();W[i].clear();
            for(int j=0;j<20;++j)fa[j][i]=0;
            IDA[i]=IDB[i]=Lim[i]=pos[i]=deg[i]=0;
            dis[i]=ans=val[i]=lenA[i]=nd[i]=0;
        }
        last=tot=1;TOT=0;
    }
    return 0;
}

猜你喜欢

转载自www.cnblogs.com/cjyyb/p/10699116.html