[SPOJ] (1812) Longest Common Substring II ---- SAM(多个串的最长公共子串)

版权声明:本文为博主原创文章,转载请预先通知博主(〃▽〃)。 https://blog.csdn.net/m0_37624640/article/details/83345136

题目传送门

做法:

  • 类似求两个串的最长公共子串。
  • 我们对第一个串建立自动机,然后把剩余的n-1个串放进自动机上匹配。
  • 每个串都保存它们在每个状态上的匹配的最大长度ml, 然后对于每个状态,维护一个数组mn[p],表示当前串在此状态的LCS。对于每个状态我们要取mn[p]中的最小值。然后答案就是所有状态中最小值的最大值。
  • 注意,如果当前状态存在祖先,那么它的祖先的ml要更新其length,为什么呢?
  • 因为孩子结点匹配过了,那么长度一定大于祖先的匹配长度。我们在匹配的过长中,如果只是找到了一个子串,可能遗漏了祖先没有匹配到,这样导致祖先的ml为0,在更新状态去min的时候,会去到0,这样就错了。所以我们可以把祖先的ml赋值为祖先的length。因为当前结点的length一定大于其祖先。

AC代码:

#include<bits/stdc++.h>
using namespace std;

#define IO          ios_base::sync_with_stdio(0),cin.tie(0),cout.tie(0)
#define pb(x)       push_back(x)
#define sz(x)       (int)(x).size()
#define sc(x)       scanf("%d",&x)
#define abs(x)      ((x)<0 ? -(x) : x)
#define all(x)      x.begin(),x.end()
#define mk(x,y)     make_pair(x,y)
#define fin         freopen("in.txt","r",stdin)
#define fout        freopen("out.txt","w",stdout)

typedef long long ll;
const int mod = 1e9+7;
const double PI = 4*atan(1.0);
const int maxm = 1e8+5;
const int maxn = 1e5+5;
const int INF = 0x3f3f3f3f;
const ll LINF = 1ll<<62;

int ml[maxn<<1];
int mn[maxn<<1];
char s[maxn],b[maxn];
struct SuffixAutoMation{
    int root,cnt,last,len;
    int trans[maxn<<1][26],slink[maxn<<1],l[maxn<<1],num[maxn<<1];
    int c[maxn<<1],rk[maxn<<1];
    inline void init()
    {
        root = cnt = last = 1;
        memset(trans,0,sizeof(trans));
        slink[1] = l[1] = 0;
    }
    inline void add(int x)
    {
        int p = last,np = ++cnt;last = np;l[np] = l[p]+1;
        for(;p && !trans[p][x];p = slink[p]) trans[p][x] = np;
        if(!p) slink[np] = 1;
        else{
            int q = trans[p][x];
            if(l[p]+1 == l[q]) slink[np] = q;
            else{
                int nq = ++cnt;l[nq] = l[p]+1;
                memcpy(trans[nq],trans[q],sizeof(trans[q]));
                slink[nq] = slink[q];
                slink[q] = slink[np] = nq;
                for(;trans[p][x] == q; p = slink[p]) trans[p][x] = nq;
            }
        }
    }
    inline void build()
    {
        init();
        scanf("%s",s+1);
        len = strlen(s+1);
        for(int i=1;i<=len;i++) add(s[i]-'a');
    }
    inline void toposort()//拓扑排序是对每个状态的最长
    {
        for(int i=1;i<=cnt;i++) c[l[i]]++;
        for(int i=1;i<=len;i++) c[i]+=c[i-1];
        for(int i=1;i<=cnt;i++) rk[c[l[i]]--] = i;
    }
    inline void Find() 
    {
        int m = strlen(b+1);
        int res = 0,ans = 0,p = root;
        for(int i=1;i<=m;i++)
        {
            int x = b[i]-'a';
            if(trans[p][x]) res++,p = trans[p][x];
            else{
                for(;p && !trans[p][x];p = slink[p]);
                if(!p) res = 0,p = root;
                else res = l[p]+1, p = trans[p][x];
            }
            ml[p] = max(ml[p],res);
        }
        for(int i=cnt;i>=1;i--)
        {
            int x = rk[i];
            mn[x] = min(mn[x],ml[x]);
            if(ml[x] && slink[x]) ml[slink[x]] = l[slink[x]];
            ml[x] = 0;
        }
    }
}sam;
int main()
{
    // fin;
    // IO;
    memset(mn,INF,sizeof(mn)); //初始化为无限大
    sam.build();
    sam.toposort();
    // for(int i=sam.cnt;i>=1;i--) cout<<sam.rk[i]-1<<" "<<sam.slink[sam.rk[i]]-1<<endl;//**!  
    // cout<<endl;
    while(~scanf("%s",b+1))
    {
        sam.Find();
    }
    int res = 0;
    for(int i=1;i<=sam.cnt;i++) res = max(res,mn[i]);
    printf("%d\n",res);
    return 0;
}

猜你喜欢

转载自blog.csdn.net/m0_37624640/article/details/83345136