7-7 串的模式匹配 (25 分)

给定两个由英文字母组成的字符串 String 和 Pattern,要求找到 Pattern 在 String 中第一次出现的位置,并将此位置后的 String 的子串输出。如果找不到,则输出“Not Found”。

本题旨在测试各种不同的匹配算法在各种数据情况下的表现。各组测试数据特点如下:

数据0:小规模字符串,测试基本正确性;
数据1:随机数据,String 长度为 10
​5
​​ ,Pattern 长度为 10;
数据2:随机数据,String 长度为 10
​5
​​ ,Pattern 长度为 10
​2
​​ ;
数据3:随机数据,String 长度为 10
​5
​​ ,Pattern 长度为 10
​3
​​ ;
数据4:随机数据,String 长度为 10
​5
​​ ,Pattern 长度为 10
​4
​​ ;
数据5:String 长度为 10
​6
​​ ,Pattern 长度为 10
​5
​​ ;测试尾字符不匹配的情形;
数据6:String 长度为 10
​6
​​ ,Pattern 长度为 10
​5
​​ ;测试首字符不匹配的情形。
输入格式:
输入第一行给出 String,为由英文字母组成的、长度不超过 10
​6
​​ 的字符串。第二行给出一个正整数 N(≤10),为待匹配的模式串的个数。随后 N 行,每行给出一个 Pattern,为由英文字母组成的、长度不超过 10
​5
​​ 的字符串。每个字符串都非空,以回车结束。

输出格式:
对每个 Pattern,按照题面要求输出匹配结果。

输入样例:

abcabcabcabcacabxy
3
abcabcacab
cabcabcd
abcabcabcabcacabxyz

输出样例:

abcabcacabxy
Not Found
Not Found

测试成功代码

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define NotFound -1

int KMP(char *string, char *pattern);
void BuildMatch(char *pattern, int *match);


int main()
{
    
    
    char string[1000001] = {
    
    0};
    char pattern[100001] = {
    
    0};
    int n,i;
    scanf("%s\n", (char *)&string);///输入第一行给出 String
    scanf("%d",&n);///第二行给出一个正整数 N(≤10),为待匹配的模式串的个数

    for(i=0; i<n; i++){
    
     //随后 N 行,每行给出一个 Pattern
        scanf("%s\n", (char *)&pattern);
        int p = KMP(string, pattern);
        if(p == NotFound){
    
    
            if(i == n - 1) {
    
    
                printf("Not Found");
            } else {
    
    
                printf("Not Found\n");
            }//if...else...
        }else{
    
    
            if(i == n - 1) {
    
    
                printf("%s", (char *)string+p);
            } else {
    
    
                printf("%s\n", (char *)string+p);
            }//if...else...
        }//if...else...
    }//for
    return 0;
}
int KMP(char *string, char *pattern)
{
    
    
    int n = strlen(string);
    int m = strlen(pattern);
    int s,p,*match;

    if(n < m) return NotFound;
    match = ((int *)malloc(sizeof(int)*m));
    BuildMatch(pattern,match);
    s = p = 0;
    while(s<n && p<m){
    
    
        if(string[s] == pattern[p]){
    
    s++; p++;}
        else if(p>0) p = match[p-1]+1;
        else s++;
    }
    return (p==m) ? (s-m) : NotFound;
}
void BuildMatch(char *pattern, int *match)
{
    
    
    int i,j;
    int m = strlen(pattern);
    match[0] = -1;
    for(j=1; j<m; j++){
    
    
        i = match[j-1];
        while ( (i>=0) && (pattern[i+1]!=pattern[j]) ) i = match[i];
        if ( pattern[i+1]==pattern[j] ) match[j] = i+1;
        else match[j] = -1;
    }//for
}

注:string和pattern的数组下标一定要再1000000和100000的基础加1,
借鉴浙江大学数据结构视频讲解:
https://www.bilibili.com/video/BV1Kb41127fT?p=147

猜你喜欢

转载自blog.csdn.net/YSA_SFPSDPGY/article/details/115262343