P3375 【模板】KMP字符串匹配(kmp)

题目传送门

首先,我觉得这篇博客讲的算非常好的了。链接->点这里

kmp: kmp,字符串匹配,检索一个小串是否在另一个大串中出现过,并且可以统计次数,比如我们需要在一个祖安人写的文章中找出他说了多少个 “sbsbsb” 然后根据情况判定该禁言多久。我们暴力的从每一个字符开始,截取6个字符,逐一比较,这肯定可以,但是时间复杂度为O(n*m),即两个串长度的乘积。而kmp算法可以做到O(n+m)。

重头戏:nxt数组
我们用nxt[i]表示我们的小串的下标为1~i的子串,最长相同前缀和后缀长度。(ps:前缀不能包括最后一个字符,后缀不能包括第一个字符,不然不就是整个串嘛。)比如 ababab,我们求得nxt[]={0,0,1,2,3,4}。

如何求nxt数组

void build_nxt()
{
    int k=0;
    for(int q=2;q<=lenp;q++)//p是要寻找的串。
    {
        while(k&&p[k+1]!=p[q])//失配,就往回走,难点。
        {
            k=nxt[k];
        }
        if(p[k+1]==p[q])//成功匹配
        {
            k++;
        }
        nxt[q]=k;//前q个的最长相同前后缀的长度为k
    }
}

这个地方我想了很久,也应该是这里最难的。

        while(k&&p[k+1]!=p[q])
        {
            k=nxt[k];
        }

如果失配,说明这里不行了,我们要重新寻找匹配串,由于我们在q-1的时候,最长相同前后缀的长度为k,失配之后,k=nxt[k]。比如串“abacabad”,我们在k=3的时候,对于k+1的c会与d失配,我们就k=nxt[k]=nxt[3]=1,然后看此时的k+1是否和d匹配,因为之前有前面的aba和后面的aba一样,且aba有公共前缀和后缀,所以第一个aba串的前缀可以等于第二个aba串的后缀,直接看此时b和d是否匹配,不匹配再k=nxt[k]。

kmp函数的主体
其实和创建nxt数组差不多,这里是目标串和文本串匹配,之前是目标串自身匹配。

int kmp()
{
    build_nxt();
    int k=0;
    for(int i=1;i<=lens;i++)
    {
        while(k&&p[k+1]!=s[i])
        {
            k=nxt[k];
        }
        if(p[k+1]==s[i])
        {
            k++;
        }
        if(k==lenp)
        {
            cout<<i-lenp+1<<endl;
            k=nxt[k];//匹配成功,直接从下一个开始
        }
    }
}

模板代码

#include<bits/stdc++.h>
#define endl '\n'
#define null NULL
#define ls p<<1
#define rs p<<1|1
#define fi first
#define se second
#define mp make_pair
#define pb push_back
#define ll long long
#define int long long
#define vi vector<int>
#define mii map<int,int>
#define pii pair<int,int>
#define ull unsigned long long
#define all(x) x.begin(),x.end()
#define IOS ios::sync_with_stdio(false);cin.tie(0);cout.tie(0);
#define ct cerr<<"Time elapsed:"<<1.0*clock()/CLOCKS_PER_SEC<<"s.\n";
char *fs,*ft,buf[1<<20];
#define gc() (fs==ft&&(ft=(fs=buf)+fread(buf,1,1<<20,stdin),fs==ft))?0:*fs++;
inline int read(){
int x=0,f=1;char ch=gc();
while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=gc();}
while(ch>='0'&&ch<='9'){x=x*10+ch-'0';ch=gc();}
return x*f;}
using namespace std;
const int N=1e6+5;
const int inf=0x7fffffff;
const int mod=998244353;
const double eps=1e-6;
char p[N],s[N];
int nxt[N];
int lenp,lens;
void build_nxt()
{
    int k=0;
    for(int q=2;q<=lenp;q++)
    {
        while(k&&p[k+1]!=p[q])
        {
            k=nxt[k];
        }
        if(p[k+1]==p[q])
        {
            k++;
        }
        nxt[q]=k;
    }
}
int kmp()
{
    build_nxt();
    int k=0;
    for(int i=1;i<=lens;i++)
    {
        while(k&&p[k+1]!=s[i])
        {
            k=nxt[k];
        }
        if(p[k+1]==s[i])
        {
            k++;
        }
        if(k==lenp)//匹配成功
        {
            cout<<i-lenp+1<<endl;
            k=nxt[k];
        }
    }
}
signed main()
{
    scanf("%s",s+1);lens=strlen(s+1);//字符串开头从1开始
    scanf("%s",p+1);lenp=strlen(p+1);
    kmp();
    for(int i=1;i<=lenp;i++)
    {
        cout<<nxt[i]<<' ';//题目要求输出nxt数组
    }
}

原创文章 144 获赞 13 访问量 8673

猜你喜欢

转载自blog.csdn.net/Joker_He/article/details/105920231