正则表达式-- (?:pattern)与(?=pattern)的区别

正则表达式-- (?:pattern)与(?=pattern)的区别

2018年04月20日 13:48:44 shashagcsdn 阅读数:115 标签: 正则表达式 非获取匹配 更多

个人分类: 学习笔记

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/shashagcsdn/article/details/80017678

学习正则表达式时,对(?:pattern)与(?=pattern)的区别做个记录。

官方定义

(pattern) : 匹配 pattern 并获取这一匹配,所获取的匹配可以从产生的 Matches 集合得到。
(?:pattern) :匹配 pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。
(?=pattern) :正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。

共同点

(?:pattern)(?=pattern)都匹配pattern,但不会把pattern结果放到Matches的集合中。

区别

  • (?:pattern) 匹配得到的结果包含pattern,(?=pattern) 则不包含。如:
对字符串:"industry abc"的匹配结果:
industr(?:y|ies) ---> "industry"
industr(?=y|ies) ---> "industr"
  • 1
  • 2
  • 3
  • 是否消耗字符
    (?:pattern) 消耗字符,下一字符匹配会从已匹配后的位置开始。
    (?=pattern) 不消耗字符,下一字符匹配会从预查之前的位置开始。
    即后者只预查,不移动匹配指针。如:
    正则表达式非获取匹配

注:示例中的位置为易于理解的视图位置,具体传动原理可以参照这篇文章 正则基础之——NFA引擎匹配原理 (感谢这个作者的分析)。

猜你喜欢

转载自blog.csdn.net/u010506876/article/details/82837533