python正则表达式(3)--match search方法

1.re.match函数

re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回None。

(1)函数语法

  re.match(pattern, string, flags=0)

  函数参数说明:

    pattern   匹配的正则表达式

    string      要匹配的字符串

    flgs         标志位,用于控制正则表达式的匹配方式

  我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

    group(num=0)   获取匹配结果的各个分组的字符串,group() 可以一次输入多个组号,此时返回一个包含那些组所对应值的元组。

    groups()            返回一个包含所有分组字符串的元组。

    注意:如果未匹配成功,match()返回值为None,此时再使用group()、groups()  方法会报错。

         应该先获取匹配对象,然后判断匹配对象是否非空,当非空时在使用group()、groups()  方法获取匹配结果。见实例2

(2)实例

    例1

    import re
    print(re.match(r'How''How are you').span())   # 在起始位置匹配
    print(re.match(r'are''How are you'))                # 不在起始位置匹配

    以上输出结果为:

  (0, 3) None

    例2

 import re
 content = '577 zeke'
 result = re.match(r'[a-z]\d' , content)
 if result:
   print result.group()
 else:
   print 'No match!'

 以上执行结果如下:

 No match!

2.pattern.match方法

(1) 函数语法

  pattern.match( string, pos=0, endpos=len(string))

  函数作用:

    这个方法将在字符串string的pos位置开始 尝试匹配pattern(pattern就是通过 re.compile()方法编译后返回的对象),如 果pattern匹配成功,无论是否达到结束位 置endpos,都会返回一个匹配成功后的 Match对象;

    如果匹配不成功,或者 pattern未匹配结束就达到endpos,则返回 None。

  函数参数说明:

    string:被匹配的字符串 

    pos:匹配的起始位置,可选,默认为0

    endpos:匹配的结束位置,可选,默认为 len(string)

3. re.match和pattern.match区别

  re.match方法与pattern.match()方法 区别在于,它不能指定匹配的区 间pos和endpos两个参数

search

1.re.search函数

re.search 扫描整个字符串并返回第一个成功的匹配,如果匹配失败search()就返回None。

(1)函数语法

  re.search(pattern, string, flags=0)

  函数参数说明:

    pattern   匹配的正则表达式

    string      要匹配的字符串

    flgs         标志位,用于控制正则表达式的匹配方式

  我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

    group(num=0)   获取匹配结果的各个分组的字符串,group() 可以一次输入多个组号,此时返回一个包含那些组所对应值的元组。

    groups()            返回一个包含所有分组字符串的元组。

    注意:如果未匹配成功,search()返回值为None,此时再使用group()、groups()  方法会报错。

         应该先获取匹配对象,然后判断匹配对象是否非空,当非空时在使用group()、groups()  方法获取匹配结果。见实例2

(2)实例

    例1

    import re
    print(re.search(r'How''How are you').span())              # 在起始位置匹配
    print(re.search(r'are''How are you').span())                # 不在起始位置匹配

    以上输出结果为:

  (0, 3) (4, 7)

    例2

 
复制代码
 import re
 content = 'Hi zeke,how old are you'
 
 result = re.search(r'\d+' , content)
 if result:
   print result.group()
 else:
   print 'No match!'
 
 rs = re.search(r'\w{4}' , content)
 if rs:
   print rs.group()
 else:
   print 'No match!'
复制代码

 以上执行结果如下:

 No match!

 zeke

2.pattern.search方法

(1) 函数语法

  pattern.search( string, pos=0, endpos=len(string))

  函数作用:

    这个方法将在字符串string的pos位置开始 尝试匹配pattern(pattern就是通过 re.compile()方法编译后返回的对象),如 果pattern匹配成功,无论是否达到结束位 置endpos,都会返回一个匹配成功后的Match对象;

    如果匹配不成功,或者 pattern未匹配结束就达到endpos,则返回 None。

  函数参数说明:

    string:被匹配的字符串 

    pos:匹配的起始位置,可选,默认为0

    endpos:匹配的结束位置,可选,默认为 len(string)

3. re.search和pattern.search区别

  re.search方法与pattern.search()方法 区别在于,它不能指定匹配的区 间pos和endpos两个参数

4. re.match方法与re.search方法的区别

  re.match只匹配字符串的开始,如果字符串开始不符合正则表达式, 则匹配失败,并返货None;

  re.search匹配整个字符串, 直到找到一个匹配,如果整个字符串都没匹配到,则返回None。

猜你喜欢

转载自www.cnblogs.com/jinan1/p/10760856.html
今日推荐