Python中re.search、re.match、re.findall的区别与联系及正则表达式group分组

1、re.search

re.search 扫描整个字符串并返回第一个成功的匹配,匹配成功re.search方法返回一个匹配的对象,否则返回None。

函数语法

re.search(pattern, string, flags=0)

  • 参数说明:
    pattern:匹配的正则表达式
    string:要匹配的字符串。
    flags:标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。

2、re.match

re.match 尝试从字符串的起始位置匹配一个模式,若匹配成功 re.match 方法返回一个匹配的对象,否则返回 None(如果不是起始位置匹配成功的话,match() 也会返回 None。)

函数语法

re.match(pattern, string, flags=0)

  • 参数说明:
    pattern:匹配的正则表达式
    string:要匹配的字符串。
    flags:标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。

3、re.findall

在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果有多个匹配模式,则返回元组列表,如果没有找到匹配的,则返回空列表。

语法格式

findall(string[, pos[, endpos]])

  • 参数说明:
    string : 待匹配的字符串。
    pos : 可选参数,指定字符串的起始位置,默认为 0。
    endpos : 可选参数,指定字符串的结束位置,默认为字符串的长度。

4、区别

re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配;而re.findall()方法匹配目标字符串中所有满足条件的正则表达式

5、正则表达式group分组

group()用来提出分组截获的字符串,在正则表达式中’()'用来分组

import re
a = "123abc456"
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0))   #123abc456,返回整体
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(1)) #123
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(2)) #abc
print(re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(3))  #456

猜你喜欢

转载自blog.csdn.net/weixin_46769840/article/details/129410254