SPOJ8093 BZOJ2780 Sevenk Love Oimaster SAM

版权声明:本文为博主原创文章,可以转载但是必须声明版权。 https://blog.csdn.net/forever_shi/article/details/84887597

题目链接

题意:
给你 n n 个字符串,有 q q 次询问,每次给你一个字符串,求这个字符串在 n n 个串中的多少个串中出现过。总串长都是1e5量级的,字符集是小写字母。

题解:
虽然据说AC自动机可能也可以做,但是显然没有用后缀自动机方便。
我们对于这 n n 个串建出SAM,串与串之间加一个分隔符隔开。然后我们要对于这个串的所有子串的出现次数都+1,并且我们要保证每个子串在加进当前这个串的时候只被加进去一次,所以我们记录每个子串最近一次更新答案是在哪一个字符串加入的时候。然后对于每次询问,我们拿出当前串,像AC自动机一样在后缀自动机上跑匹配,不断地往表示当前前缀的点走,走完之后最后所在的点累加的权值就是这个串的答案。

代码:

#include <bits/stdc++.h>
using namespace std;

int n,q,T,vis[500010],fa[500010],len[500010],ch[500010][27],lst=1,cnt=1,rt=1,val[500010];
char s[500010];
inline void insert(int x,int id)
{
    int cur=++cnt,pre=lst;
    lst=cur;
    len[cur]=len[pre]+1;
    for(;pre&&!ch[pre][x];pre=fa[pre])
    ch[pre][x]=cur;
    if(!pre)
    fa[cur]=rt;
    else
    {
        int ji=ch[pre][x];
        if(len[ji]==len[pre]+1)
        fa[cur]=ji;
        else
        {
            int gg=++cnt;
            len[gg]=len[pre]+1;
            memcpy(ch[gg],ch[ji],sizeof(ch[ji]));
            vis[gg]=vis[ji];
            val[gg]=val[ji];
            fa[gg]=fa[ji];
            fa[ji]=fa[cur]=gg;
            for(;pre&&ch[pre][x]==ji;pre=fa[pre])
            ch[pre][x]=gg;
        }
    }
    pre=cur;
    for(;pre&&vis[pre]!=id;pre=fa[pre])
    {
        ++val[pre];
        vis[pre]=id;
    }
}
int main()
{
    scanf("%d%d",&T,&q);
    while(T)
    {
        scanf("%s",s+1);
        n=strlen(s+1);
        for(int i=1;i<=n;++i)
        insert(s[i]-'a',T);
        insert(26,T);
        T--;
    }
    while(q--)
    {
        scanf("%s",s+1);
        n=strlen(s+1);
        int ji=rt;
        for(int i=1;i<=n;++i)
        {
            int x=s[i]-'a';
            ji=ch[ji][x];
        }
        printf("%d\n",val[ji]);
    }
    return 0;
}

猜你喜欢

转载自blog.csdn.net/forever_shi/article/details/84887597
SAM
今日推荐