【LeetCode】10. 正则表达式匹配(同剑指Offer19)

一、题目

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 ‘.’ 和 ‘*’ 的正则表达式匹配。

‘.’ 匹配任意单个字符
‘*’ 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

说明:

s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
示例 1:

输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。

示例 3:

输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。

示例 4:

输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c'0, 'a' 被重复一次。因此可以匹配字符串 "aab"

示例 5:

输入:
s = "mississippi"
p = "mis*is*p*."
输出: false

二、解决

1、递归

思路:

具体看参考2,然后可结合注释理解。

代码:

// V1.0
class Solution {
    
    
    public boolean isMatch(String s, String p) {
    
    
	    // Terminator
        if(p.isEmpty()) return s.isEmpty();
        // 不涉及 "*" ,单元素匹配
        boolean match = !s.isEmpty() && ((s.charAt(0) == p.charAt(0)) || p.charAt(0) == '.');
        // 涉及 ”*“ ,多元素匹配。* 的作用是 消除前面字符p[j-1],或者复制>=1个字符p[j-1]
        if(p.length() >= 2 && p.charAt(1) == '*') return isMatch(s, p.substring(2)) || (match && isMatch(s.substring(1), p));
        return match && isMatch(s.substring(1), p.substring(1));
    }
}
// V2.0:优化charAt(i),加速
class Solution {
    
    
    public boolean isMatchChar(char[] s, int s1, char[] p, int p1) {
    
    
        if(p1 >= p.length) return s1 >= s.length;
        boolean match = s1 < s.length && ((s[s1] == p[p1]) || p[p1] == '.');
        if(p.length - p1 >= 2 && p[p1 + 1] == '*') return isMatchChar(s, s1, p, p1 + 2) || (match && isMatchChar(s, s1 + 1, p, p1));
        return match && isMatchChar(s, s1 + 1, p, p1 + 1);
    }
    public boolean isMatch(String s, String p) {
    
    
        char[] ss = s.toCharArray(), pp = p.toCharArray();
        return isMatchChar(ss, 0, pp, 0);
    }
}

时间复杂度: O ( ( m + n ) ∗ 2 m + 2 n ) O((m+n)∗2^{m+ 2n}) O((m+n)2m+2n)

空间复杂度: O ( ( m + n ) ∗ 2 m + 2 n ) O((m+n)∗2^{m+ 2n}) O((m+n)2m+2n)

2、记忆化+递归

思路: 同上。
代码:

class Solution {
    
    
    int[][] mem;
    public boolean isMatchChar(char[] s, int s1, char[] p, int p1) {
    
    
        if(p1 >= p.length) return s1 >= s.length;
        if(mem[s1][p1] != 0) return mem[s1][p1] > 0;
        boolean match = s1 < s.length && ((s[s1] == p[p1]) || p[p1] == '.');
        if(p.length - p1 >= 2 && p[p1 + 1] == '*') {
    
    
            boolean t = isMatchChar(s, s1, p, p1 + 2) || (match && isMatchChar(s, s1 + 1, p, p1));
            if(t) mem[s1][p1] = 1;
            else mem[s1][p1] = -1;
            return t;
        }
        boolean t = match && isMatchChar(s, s1 + 1, p, p1 + 1);
        if(t) mem[s1][p1] = 1;
        else mem[s1][p1] = -1;
        return t;
    }
    public boolean isMatch(String s, String p) {
    
    
        this.mem = new int[s.length() + 1][p.length() + 1];
        char[] ss = s.toCharArray(), pp = p.toCharArray();
        return isMatchChar(ss, 0, pp, 0);
    }
}

时间复杂度: O ( m n ) O(mn) O(mn)
空间复杂度: O ( m n ) O(mn) O(mn)

3、动态规划

思路:

1、状态定义

dp[i][j]:表示 S 的前 i 个能否被 P 的前 j 个字符匹配。


2、转移方程

dp[i-1][j-1]: 前面字串匹配成功,即 S 的前 i-1 个字符成功匹配上 P 的前 j-1 个字符。

So

1. If p.charAt(j) == s.charAt(i) :  dp[i][j] = dp[i-1][j-1];  
// dp[i-1][j-1]: 前面字串匹配成功,后面也匹配上,全部匹配成功。

2. If p.charAt(j) == '.' : dp[i][j] = dp[i-1][j-1];
// 前面字串匹配成功,现在 j 位置的 "." 可成功匹配 s i 位置的任意一个字符,所以 dp[i][j] = dp[i-1][j-1].

3. If p.charAt(j) == '*': 
   // 有以下几种可能:
   --1if p.charAt(j-1) != s.charAt(i) : dp[i][j] = dp[i][j-2]  
   // * 代表 0 个字符,消除p 的 j-1 个字符,这种情况说明 p 的最后两个字符无效,可去除。即dp[i][j]的状态依赖于dp[i][j-2]。
   --2if p.charAt(j-1) == s.charAt(i) or p.charAt(i-1) == '.':
         dp[i][j] = dp[i-1][j]
      // * 代表多个字符,这里正向去理解,如果 代表多个,则 s 后面再添一个也不影响。
      // 例如: ## 与 ##b* 一旦匹配,则##b 与 ##b* 也匹配成功。
      or dp[i][j] = dp[i][j-1]
      // * 代表 1 个字符,即 * 可以理解为不起作用,所以dp[i][j]=dp[i][j-1]
      or dp[i][j] = dp[i][j-2]  
      // * 代表 0 个字符,消除p 的 j-1 个字符,这种情况说明 p 的最后两个字符无效,可去除。即dp[i][j]的状态依赖于dp[i][j-2]。


==>进一步整理如下:

1. p[j−1] 为 普通字符,若s[i-1]==p[j-1],则 dp[i][j] = dp[i-1][j-1],否则匹配失败。
2. p[j−1]'.',则 dp[i][j] = dp[i−1][j−1]
3. p[j−1]'*'(1)不看,则 dp[i][j] = dp[i][j-2]
   (2)看,  则 dp[i][j] = dp[i-1][j]

代码:

public class Solution {
    
    
    public boolean isMatch(String s, String p) {
    
    
        char[] str = s.toCharArray(), ptr = p.toCharArray();
        boolean[][] dp = new boolean[str.length + 1][ptr.length + 1];
        dp[0][0] = true;
        for (int i = 0; i <= str.length; i++) {
    
    
            for (int j = 1; j <= ptr.length; j++) {
    
    
                if(ptr[j - 1] != '*') {
    
    
                    if(i > 0 && (str[i - 1] == ptr[j - 1] || ptr[j - 1] == '.')) dp[i][j] = dp[i - 1][j - 1];
                }else {
    
     //ptr[j - 1] == '*'
                    if(j > 1) dp[i][j] |= dp[i][j - 2];   //不看
                    if(i > 0 && j > 1 && (str[i - 1] == ptr[j - 2] || ptr[j - 2] == '.'))dp[i][j] |= dp[i - 1][j];    //看
                }
            }
        }
        return dp[str.length][ptr.length];
    }
}

时间复杂度: O ( m n ) O(mn) O(mn)
空间复杂度: O ( m n ) O(mn) O(mn)

4、有限状态机

思路: 仅仅开拓思路,更多见参考3,具体略。
代码: 略。
时间复杂度: 略。
空间复杂度: 略。

三、参考

1、动态规划 - 从 0 讲解,大白话好理解
2、java递归一步一步的优化到击败100%,以及动态规划,思路清晰
3、正则表达式匹配
4、正则表达式匹配
5、10. Regular Expression Matching

猜你喜欢

转载自blog.csdn.net/HeavenDan/article/details/109187157