串匹配-BF和KMP算法

没想到今天是1024程序员节日,先祝大家节日快乐 希望有幸看到这篇文章的大佬们学的多不秃头(-。-)

串匹配-BF和KMP算法

串模式匹配即子串查找。设s和p是给定的两个字符串,在主串s中查找子串p的过程,成为模式匹配。如果在s中找到等于p的字串,则称匹配成功,函数返回p在s中首次出现的位置或序号,否则匹配失败,返回-1,p也称为模式串。

BF算法

解决这个问题,有两种算法,相对简单一种的叫做BF算法也叫简单匹配算法
BF算法的总体思路就是首先将s0与p0比较,若不相同,就将s1与p0比较,依次下去,直到si与p0相同,然后再比较之后的字符,就是将s(i+1)与p1比较,依次下去,若p比较到末尾,则匹配成功,若其中有一个字符不相等,则s回到本趟开始的一个字符位置,即s(i-j+1),继续下一趟的比较。
时间复杂度最好是O(n+m),最差为O(n*m)
图片1
代码如下:

public static int KM(char[] s, char[] p){
        int i = 0;
        int j = 0;
        while(i < s.length && j < p.length){
            if (s[i] == p[j]){
                i++;
                j++;
            } else {
                i = i-j+1;
                j = 0;
            }
            if (j > p.length-1) {
                return i-p.length;
            }
        }
        return -1;
    }

KMP算法

BF算法相对简单但效率较低,KMP算法对BF算法做了一些改进
在每一趟匹配中,当匹配失败,s串都要回到本串开始字符的下一个字符,模式串p要回到第一个字符,这会造成许多不必要的回溯,而KMP算法通过next数组改进了这个问题。
KMP算法的时间复杂度为O(n+m)
代码如下:

    public static int KMP(char[] s, char[] p, int[] next){
        int i = 0;
        int j = 0;
        while(i < s.length && j < p.length){
            if(j == -1 || s[i] == p[j]){
                i++;
                j++;
            }
            else{
                j = next[j];
            }
            if(j > p.length-1)
                return i-p.length;
        }
        return -1;
    }

求next的算法

KMP算法的一个难点就是求next数组的算法
next函数值取决于模式串本身而与主串无关。首先,我们可以知道**p1p2…pj-1与si…s(i+j-1)**相对应的位置是相等的
假设P1…p(j-1)中,**p1…p(k-1)与p(j-k)…p(j-1)**是一一对应相等的
那么就可以推出,**p1…p(k-1)与si…s(i+j-1)**是一一对应的。
KMP算法就是将模式串根据next右移,而主串不动。
就是说每个next值都决定了该移动多少位。
目前我看了半天也只是明白了个大概,如果有兴趣深究的,可以看看这位大佬的博客,写的是真的详细且精辟
地址链接:通俗易懂的字符串匹配KMP算法及求next值算法
膜拜大佬ing…
代码如下

public static int[] getNext(char[] p){
        int[] next = new int[p.length];
        next[0] = -1;
        int i = 0;
        int j = -1;
        while(i < p.length-1){
            if(j == -1 || p[i] == p[j]){
                i++;
                j++;
                next[i] = j;
            }
            else {
                j = next[j];
            }
        }
        return next;
    }
          j = next[j];
            }
        }
        return next;
    }
发布了63 篇原创文章 · 获赞 8 · 访问量 7213

猜你喜欢

转载自blog.csdn.net/s1547156325/article/details/102719190