字符串匹配BF/RK/BM/KMP算法

主串长度m,匹配串(模式串)长度n。

一、BF

强制算法比较,最容易想到的,时间复杂度O(m*n)

二、RK

计算出匹配串的哈希值,遍历主串,求每次对应位置相同长度的子串哈希值,比较两者是否相同。

若不相同,则肯定不匹配,主串调至下一位。若相同,由于哈希可能碰撞,还需逐个字符比较。

时间复杂度O(m)

三、BM

①,模式串与主串左对齐,从后向前比较,发现主串 T与模式串G不相等。再从模式串中此位置开始向前找到字符T位置。

②,模式串字符T位置和主串T位置对齐后,再从后向前匹配,发现直到主串A和模式串G不匹配,在从模式串中此位置开始向前找到字符A位置。

③、模式串A位置和主串A位置对齐,再从后向前便利是否匹配。发现全部匹配则找到。

四、KMP

public static int kmp(String str, String pattern) {
        //预处理,生成next数组
        int[] next = getNexts(pattern);
        int j = 0;
        for (int i = 0; i < str.length(); i++) {

            while (j>0 && pattern.charAt(j)!=str.charAt(i)){
                //遇到坏字符时,查询next数组并改变模式串的起点
                j = next[j];
            }
            if(pattern.charAt(j)==str.charAt(i)){
                j++;
            }
            if(j == pattern.length()){
                return i - pattern.length() + 1 ;
            }
        }
        return -1;
    }

    // 生成Next数组
    private static int[] getNexts(String pattern) {
        int next[] = new int[pattern.length()];
        next[0]=-1;
        int j = 0;
        for (int i = 2; i < pattern.length(); i++) {
            while (j!=0 && pattern.charAt(i-1)!=pattern.charAt(j)){
                //从next[i+1]的求解回溯到 next[j]
                j=next[j];
            }
            if(pattern.charAt(i-1)==pattern.charAt(j)){
                j++;
            }
            next[i]=j;
        }
        return next;
    }

时间复杂度O(m+n),空间复杂度O(n)

猜你喜欢

转载自blog.csdn.net/weichi7549/article/details/108549755