NOI2014 动物园(kmp)

题目描述
近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的园长决定开设算法班,让动物们学习算法。 某天,园长给动物们讲解KMP算法。

园长:“对于一个字符串S它的长度L。我们可以在O(L)的时间内求出一个名为next的数组。有谁预习了next数组的含义吗?”

熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中,它本身除外,最长的长度记作 next[i]。”

园长:“非常好,那你能举个例子吗?”

熊猫:“例如S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出 next[1] = next[2] = next[3] = 0, next[4] = next[6] = 1, next[7] = 2, next[8] = 3。”

园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组——对于字符串S的前 i 个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4]=2。这是因SS的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’。但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1]=0,num[2]=num[3]=1,num[5]=2。”

最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了。但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?

特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出 i = 1 L ( n u m [ i ] + 1 ) 对10000000071000000007取模的结果即可。

其中 i = 1 n ( n u m [ i ] + 1 ) = ( n u m [ 1 ] + 1 ) × ( n u m [ 2 ] + 1 ) × × ( n u m [ n ] + 1 )

输入格式
输入文件的第1行仅包含一个正整数n。
表示测试数据的组数。 随后n行,每行描述一组测试数据。

每组测试数据仅含有一个字符串S,S的定义详见题目描述。数据保证S,中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。

输出格式
输出文件应包含n行。

每行描述一组测试数据的答案。

答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对1000000007取模的结果。

输出文件中不应包含多余的空行。


为什么要说这么多废话。

好啦,题目都指名道姓 kmp 了,当然要用 kmp 乱搞一波。
引入一个定义,kmp自动机:
这里写图片描述
图源 syq学长(?)。!
(我们把既是前缀又是后缀的子串称作字符串的 b o d e r )。

其实就是个很简单的概念。实际操作中也不需要我们连边,只是借用这样的思路以便于理解。
我们先不考虑题目不允许前缀后缀重复的要求。预处理出 c n t [ i ] 数组,表示遍历到结点 i S [ 1.. i ] 有多少个 b o d e r 。这可以在做一遍 k m p 预处理出 n e x t 数组的同时预处理出来。
如下:

    memset(next,0,sizeof(next));
    memset(cnt,0,sizeof(cnt));
    cnt[1]=1;//注意这里!因为我们对cnt的定义,所以cnt[1]并不是0。
    int j=0;
    for(int i=2;i<=Len;++i)
    {
        while(j&&s[i]!=s[j+1]) j=next[j];
        if(s[i]==s[j+1]) ++j;
        next[i]=j;
        cnt[i]=cnt[j]+1;//通过失配边由父节点递推而来。
    }

好,那我们处理下一步。怎么样满足题目不重叠的要求呢?这一点其实很容易实现。我们再做一遍 k m p 。指针 j 按常规方法跳完之后,我们判断 j 2 是否大于 i 。若大于则说明前缀 S [ 1.. j ] S [ i j + 1.. i ] 虽然匹配,但是有重叠,那么我们就非常简单粗暴地将其判断为失配, j 继续前跳。
此时,对于当前匹配到的 i ,满足 S [ 1.. j ] S [ i j + 1.. i ] 匹配且两者不重叠的 j 已得到。因为 S [ 1.. j ] 满足条件,那么 j 沿失配边上跳得到的 S [ i j + 1.. i ] b o d e r 一定也是合法的。所以题中所求的 n u m [ i ] 即为 c n t [ j ] ,即合法前缀数。
如下:

    j=0;
    for(int i=2;i<=Len;++i)
    {
        while(j&&s[i]!=s[j+1]) j=next[j];
        if(s[i]==s[j+1]) ++j;
        while((j<<1)>i) j=next[j];
        ans=(ans*(1LL*(cnt[j]+1)%mul))%mul;
    }

一个很小的优化:因为我们可以保证 i 相同时,第二次 k m p 调用的值在第一次 k m p 俱已求得。这很显然……所以我们可以把这两个过程塞在一个循环里。
注意 a n s l o n g l o n g

C o d e

#include<bits/stdc++.h>
using namespace std;

const int maxn=1000001;
const int mul=1000000007;

int n;
char s[maxn];
int Len;
int next[maxn];
int cnt[maxn];
long long ans;


inline void read(int &x)
{
    x=0;int f=1;char s=getchar();
    for(;s<'0'||s>'9';s=getchar()) if(s=='-') f=-1;
    for(;s>='0'&&s<='9';s=getchar()) x=(x<<3)+(x<<1)+s-48;
    x*=f;
}

void Kmp()
{
    memset(next,0,sizeof(next));
    memset(cnt,0,sizeof(cnt));
    ans=1;
    cnt[1]=1;
    int Point1=0,Point2=0;
    for(int i=2;i<=Len;++i)
    {
        while(Point1&&s[i]!=s[Point1+1]) Point1=next[Point1];
        if(s[i]==s[Point1+1]) ++Point1;
        next[i]=Point1;
        cnt[i]=cnt[Point1]+1;

        while(Point2&&s[i]!=s[Point2+1]) Point2=next[Point2];
        if(s[i]==s[Point2+1]) ++Point2;
        while((Point2<<1)>i) Point2=next[Point2];
        ans=(ans*(1LL*(cnt[Point2]+1)%mul))%mul;
    }
}

void Work()
{
    read(n);
    for(int i=1;i<=n;++i)
    {
        scanf("%s",s+1);Len=strlen(s+1);
        Kmp();
        printf("%lld\n",ans);
    }
}

int main()
{
    Work();
    return 0;
}

猜你喜欢

转载自blog.csdn.net/hfl030/article/details/81047618