KMP字符串

题目链接：https://www.acwing.com/problem/content/833/
题意：给定一个模式串S，以及一个模板串P，所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串P在模式串S中多次作为子串出现。
求出模板串P在模式串S中所有出现的位置的起始下标。
输入格式
第一行输入整数N，表示字符串P的长度。
第二行输入字符串P。
第三行输入整数M，表示字符串S的长度。
第四行输入字符串S。
数据范围
1≤N≤1e4
1≤M≤1e5
输入样例：
3
aba
5
ababa
输出样例：
0 2
思路：一般暴力做法两重循环时间复杂度就至少是O(n²)的，而其实很多地方都有重复，便可以用到kmp算法优化一下。
对于模板数组p我们开一个next数组来统计它前缀子串与后缀子串相同的最大值，例如：
在这里插入图片描述
所以每次移动的时候只需要找到相应的next关系便可以了（相当于每次在j的位置匹配不成功，便找到模板的最大前缀后缀匹配度ne[ j ]，那么下一次p和s就可以在j的前面ne[ j ]个位置再重新开始便可。），时间复杂度一下就降到了O(2 * m)了。
代码实现：

#include<iostream>
using namespace std;
const int N = 1e5 + 5, M = 1e6 + 5;
//n是模板p的长度，m是模式串s的长度
int n, m;
char p[N], s[M];
int ne[N];
int main()
{
    cin >> n >> p + 1 >> m >> s + 1;
    //求next的过程
    for(int i = 2, j = 0; i <= n; i ++ ){
        while(j && p[i] != p[j + 1]) j = ne[j];
        if(p[i] == p[j + 1]) j ++ ;
        ne[i] = j;
    }
    //kmp匹配过程
    for(int i = 1, j = 0; i<=m; i ++ ){
        //如果匹配不成功就退一步再匹配
        while(j && s[i] !=p[j + 1]) j = ne[j];
        if(s[i] == p[j + 1]) j ++ ;
        if(j == n){
            cout << i - n << " ";
            j = ne[j];
        }
    }
    return 0;
}

Saturd

发布了61 篇原创文章 · 获赞 0 · 访问量 960

私信关注

猜你喜欢