爬虫:Re库的贪婪匹配和最小匹配

版权声明:关注微信公众号:摸鱼科技资讯,联系我们 https://blog.csdn.net/qq_36949176/article/details/84451267

贪婪匹配

Re库默认采用贪婪匹配,即输出匹配最长的子串。

>>> import re
>>> match=re.search(r'PY.*N','PYANBNCNDN')
>>> match.group(0)
'PYANBNCNDN'

最小匹配

如何输出最短的子串呢?

对!那就加个问号吧~

>>> import re
>>> match=re.search(r'PY.*?N','PYANBNCNDN')
>>> match.group(0)
'PYAN'

                                                          最小匹配操作符

操作符 说明
*? 前一个字符0次或无限次扩展,最小匹配
+? 前一个字符1次或无限次扩展,最小匹配
?? 前一个字符0次或1次扩展,最小匹配
{m,n}? 扩展前一个字符m至n次(含n),最小匹配

猜你喜欢

转载自blog.csdn.net/qq_36949176/article/details/84451267