剑指Offer第五十二题:正则表达式匹配

题目描述

请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配

思路:

情况还是有些复杂的,先看下输入和输出的例子(假设原来字符数组str,跟它匹配的为pattern)

"aaa" 与 "a.a"和"ab*ac*a" 匹配,'.'表示任意一个字符,'*'表示它前面的字符可以出现任意次(包含0次),按照这个说法可以得到如下结论

  • 首先如果模式匹配字符的下一个字符不是‘*’,进行逐字符匹配,遇到 ‘.’ 比较简单,’.’ 和一个字符匹配 match(str+1, pattern+1);
  • 需要注意要排除特殊情况, “.*”,“.*.*.*”等,这种实际上就等于“”;

最难的一块就是类似:“aaabbbccc”与 “a*b*c*”也相等,所以我们需要判断有几位相等;

解决办法:如果遇到不匹配,而是pattern这一位是 “*” ,则有三种情况:

  1. pttern当前字符能匹配 str 中的 0 个字符;
  2. pttern当前字符能匹配 str 中的 1 个字符:match(str+1, pattern+2)
  3. pttern当前字符能匹配 str 中的 多 个字符:match(str+1, pattern)

这里就是需要利用递归,继续判断下个str是否吻合。

余下情况,若遇到不匹配,也不是上面的情况,除了str和pattern均为 '\0' 以外都返回错。

代码如下:(参考某大神,这篇直接当转载)

class Solution {
public:
    bool match(char* str, char* pattern)
    {
        if(str==NULL || pattern==NULL)
            return false;
        if(*str == '\0' && *pattern == '\0')
            return true;
        if((*str != '\0' && *pattern == '\0'))
            return false;
        
        if(*(pattern + 1) == '*'){
            // 如果字符串和模式串相等,或者模式串是'.',并且字符串没有到结尾,则继续匹配
            if(*str == *pattern || (*pattern == '.' && *str != '\0')){
                // 进入下一个状态,就是匹配到了一个
                return match(str + 1, pattern + 2) ||
                        // 保持当前状态,就是继续那这个'*'去匹配
                        match(str + 1, pattern) ||
                        // 跳过这个'*'
                        match(str, pattern + 2);
            }
            // 如果字符串和模式串不相等,则跳过当前模式串的字符和'*',进入新一轮的匹配
            else{
                // 跳过这个'*'
                return match(str, pattern + 2);
            }
        }
        if(*str == *pattern || (*pattern == '.' && *str != '\0'))
            return match(str + 1, pattern + 1);
        return false;
    }
};

猜你喜欢

转载自blog.csdn.net/weixin_42513339/article/details/89294508