题目描述
请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"与模式"a.a"和"ab*ac*a"匹配,但是与"aa.a"和"ab*a"均不匹配
思路:
情况还是有些复杂的,先看下输入和输出的例子(假设原来字符数组str,跟它匹配的为pattern)
"aaa" 与 "a.a"和"ab*ac*a" 匹配,'.'表示任意一个字符,'*'表示它前面的字符可以出现任意次(包含0次),按照这个说法可以得到如下结论
- 首先如果模式匹配字符的下一个字符不是‘*’,进行逐字符匹配,遇到 ‘.’ 比较简单,’.’ 和一个字符匹配 match(str+1, pattern+1);
- 需要注意要排除特殊情况, “.*”,“.*.*.*”等,这种实际上就等于“”;
最难的一块就是类似:“aaabbbccc”与 “a*b*c*”也相等,所以我们需要判断有几位相等;
解决办法:如果遇到不匹配,而是pattern这一位是 “*” ,则有三种情况:
- pttern当前字符能匹配 str 中的 0 个字符;
- pttern当前字符能匹配 str 中的 1 个字符:match(str+1, pattern+2)
- pttern当前字符能匹配 str 中的 多 个字符:match(str+1, pattern)
这里就是需要利用递归,继续判断下个str是否吻合。
余下情况,若遇到不匹配,也不是上面的情况,除了str和pattern均为 '\0' 以外都返回错。
代码如下:(参考某大神,这篇直接当转载)
class Solution {
public:
bool match(char* str, char* pattern)
{
if(str==NULL || pattern==NULL)
return false;
if(*str == '\0' && *pattern == '\0')
return true;
if((*str != '\0' && *pattern == '\0'))
return false;
if(*(pattern + 1) == '*'){
// 如果字符串和模式串相等,或者模式串是'.',并且字符串没有到结尾,则继续匹配
if(*str == *pattern || (*pattern == '.' && *str != '\0')){
// 进入下一个状态,就是匹配到了一个
return match(str + 1, pattern + 2) ||
// 保持当前状态,就是继续那这个'*'去匹配
match(str + 1, pattern) ||
// 跳过这个'*'
match(str, pattern + 2);
}
// 如果字符串和模式串不相等,则跳过当前模式串的字符和'*',进入新一轮的匹配
else{
// 跳过这个'*'
return match(str, pattern + 2);
}
}
if(*str == *pattern || (*pattern == '.' && *str != '\0'))
return match(str + 1, pattern + 1);
return false;
}
};