KMP字符串

题目链接:https://www.acwing.com/problem/content/833/
题意:给定一个模式串S,以及一个模板串P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串P在模式串S中多次作为子串出现。
求出模板串P在模式串S中所有出现的位置的起始下标。
输入格式
第一行输入整数N,表示字符串P的长度。
第二行输入字符串P。
第三行输入整数M,表示字符串S的长度。
第四行输入字符串S。
数据范围
1≤N≤1e4
1≤M≤1e5
输入样例:
3
aba
5
ababa
输出样例:
0 2
思路:一般暴力做法两重循环时间复杂度就至少是O(n²)的,而其实很多地方都有重复,便可以用到kmp算法优化一下。
对于模板数组p我们开一个next数组来统计它前缀子串与后缀子串相同的最大值,例如:
在这里插入图片描述
所以每次移动的时候只需要找到相应的next关系便可以了(相当于每次在j的位置匹配不成功,便找到模板的最大前缀后缀匹配度ne[ j ],那么下一次p和s就可以在j的前面ne[ j ]个位置再重新开始便可。),时间复杂度一下就降到了O(2 * m)了。
代码实现:

#include<iostream>
using namespace std;
const int N = 1e5 + 5, M = 1e6 + 5;
//n是模板p的长度,m是模式串s的长度
int n, m;
char p[N], s[M];
int ne[N];
int main()
{
    cin >> n >> p + 1 >> m >> s + 1;
    //求next的过程
    for(int i = 2, j = 0; i <= n; i ++ ){
        while(j && p[i] != p[j + 1]) j = ne[j];
        if(p[i] == p[j + 1]) j ++ ;
        ne[i] = j;
    }
    //kmp匹配过程
    for(int i = 1, j = 0; i<=m; i ++ ){
        //如果匹配不成功就退一步再匹配
        while(j && s[i] !=p[j + 1]) j = ne[j];
        if(s[i] == p[j + 1]) j ++ ;
        if(j == n){
            cout << i - n << " ";
            j = ne[j];
        }
    }
    return 0;
}

发布了61 篇原创文章 · 获赞 0 · 访问量 960

猜你喜欢

转载自blog.csdn.net/Satur9/article/details/104085062
今日推荐