kmp算法是用来对字符串进行匹配的一种算法。对于长度为n的字符串N,要查找其中长度为m的一个字符串M,传统的暴力方法的复杂度为O( n*m ),而用kmp算法时间复杂度为O( m+n )。因此,kmp算法是一种很实用的算法,在acm竞赛中是一种必会算法之一
KMP算法详解
kmp算法的实现是借助了一个next数组,该数组是通过对要查找的字符串M进行预处理,然后实现在查找是如果在i位出现不匹配的话,并非从头到尾全部重新匹配(暴力的方法),而是用next数组找到能够最大满足前缀匹配的下标。
具体如图所示:(图片参考)
- 构造next数组
- 进行匹配,出现不成功
- 借助next数组进行保留最长前缀的匹配 v
代码实现
#include<bits/stdc++.h>
bool SUBMIT = false;
using namespace std;
const int inf = 1000;
int nex[inf];
string s,h;
void Getnex(string m)//对kmp数组的构造
{
nex[0]=-1;
int k=-1,j=0;
while(j<m.size())
{
if(k==-1||m[k]==m[j])
{
k++;j++;
nex[j]=k;
}else
k=nex[k];
}
}
int kmp()//用kmp进行匹配
{
int k=0,j=0;
while(j<h.size())
{
if(k==-1||s[k]==h[j])
{
k++;j++;
}else{
k=nex[k];
cout<<k<<" "<<j<<endl;
}
if(k == s.size())
return j-k;
}
return -1;
}
int main()
{
if(SUBMIT)freopen("i.txt","r",stdin);else _;
cin>>h>>s;
cout<<h<<endl<<s<<endl;
Getnex(s);
for(int i=0;i<s.size();i++)
cout<<nex[i];
cout<<endl;
int ans=kmp();
cout<<ans<<endl;
return 0;
}
- 其实我对kmp构造的快速理解就是kmp首先对字符串处理的保证c = next [ i ]本身指定的位置为 c 的前 c - 1 位是匹配的。因此,在构造的时候用了如果第k 为 和第 j 为相等,那么保证nex [ j + 1 ] = k+1;