洛谷3966 BZOJ3172 单词 AC自动机

题目链接
题意:
给你n个字符串,求每个字符串在所有字符串中出现了几次。

题解:
需要字符串匹配,还是多串匹配,不难想到要AC自动机。但是不能直接用AC自动机匹配,因为可能是另一个串的子串。我们考虑建AC自动机的过程,我们在一个一个插入字符串的过程中,一旦经过了trie树上的某个节点,就意味着根到该节点的字符串又出现了一次,所以建trie树时一路上给每个经过节点的经过次数都加一,并且记录每个串最终的结束节点在trie树上的标号。但是由于每个字符串还可能出现在别的串的子串里,所以我们还要利用fail指针。我们考虑fail指针的含义,根到fail指针其实可以表示当前字符串的一个后缀,那么当前串出现了几次,它的后缀也相应的出现了几次,所以我们应该在fail[i]处加上i处的次数。而fail指针指向的节点深度肯定不大于当前节点,所以我们就要从深度大的向深度小的更新,而这个深度是可以按照建fail指针被遍历到的顺序依次单调不降的,于是我们倒叙枚举构建fail指针时被遍历的顺序来更新答案即可。

代码:

#include <bits/stdc++.h>
using namespace std;

int n,ans[1000010],pos[1000010];//pos记录每个字符串最后一个字符在trie上对应节点的编号
int fail[1000010],ch[1000010][26],cnt; 
int xu[1000010],ji;//ji记录建fail指针时被访问的顺序 
queue <int> q;
char s[1000010];
inline void build(int x)
{
    int cur=0;
    for(int i=0;i<strlen(s);++i)
    {
        if(!ch[cur][s[i]-'a'])
        ch[cur][s[i]-'a']=++cnt;
        cur=ch[cur][s[i]-'a'];
        ++ans[cur];     
    }
    pos[x]=cur;
}
inline void get_fail()
{
    for(int i=0;i<=25;++i)
    {
        if(ch[0][i])
        {
            fail[ch[0][i]]=0;
            q.push(ch[0][i]);
        }
    }
    xu[++ji]=0;
    while(!q.empty())
    {
        int x=q.front();
        q.pop();
        xu[++ji]=x;
        for(int i=0;i<=25;++i)
        {
            if(ch[x][i])
            {
                q.push(ch[x][i]);
                fail[ch[x][i]]=ch[fail[x]][i];
            }
            else
            ch[x][i]=ch[fail[x]][i];
        }
    }
}
int main()
{
    scanf("%d",&n);
    for(int i=1;i<=n;++i)
    {
        scanf("%s",s);
        build(i);
    }
    get_fail();
    for(int i=ji;i>=1;--i)
    ans[fail[xu[i]]]+=ans[xu[i]];
    for(int i=1;i<=n;++i)
    printf("%d\n",ans[pos[i]]);
    return 0;
}

猜你喜欢

转载自blog.csdn.net/forever_shi/article/details/81394821