正则表达式分组与贪婪匹配

这里的代码示例我用python实现一下:

分组就是把一个正则表达式的各个子表达式部分用括号括起来,然后可以调用groups()方法,获取所有的分组,python返回的是元组(X,XX,XXX)。

调用group(0)返回的是原字符串,group(1)返回的是分组匹配的第一个,group(2)返回的是分组匹配的是第二个,一次类推。

示例:我们简单匹配一下邮件地址

import re

re_email=re.compile(r'^(\w?|[<]{0,1}\w*[>]{0,1})[@]{1}(\w*\.\w*)$')

re_email.match('<ShyBee>@163.com').groups()

这就是正则表达式分组的概念,很强大,很好用。继续说一下正则表达式的贪婪匹配原则:正则匹配默认是贪婪匹配,也就是匹配尽可能多的字符

当使用\d+时,分组会匹配尽可能多的数字,这样就导致分组(0*)没有匹配到任何字符,可以使用?取消贪婪模式,结果如上图所示。

扫描二维码关注公众号,回复: 1833868 查看本文章

猜你喜欢

转载自www.cnblogs.com/render-inside/p/9253165.html