python正则表达式(3)--match search方法

1.re.match函数

re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回None。

(1)函数语法：

　 re.match(pattern, string, flags=0)

　　函数参数说明：

　　　　pattern 匹配的正则表达式

　　　　string 要匹配的字符串

　　　　flgs 标志位，用于控制正则表达式的匹配方式

　　我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

　　group(num=0) 获取匹配结果的各个分组的字符串，group() 可以一次输入多个组号，此时返回一个包含那些组所对应值的元组。

　　groups() 返回一个包含所有分组字符串的元组。

　　注意：如果未匹配成功，match()返回值为None，此时再使用group()、groups() 方法会报错。

　　　　应该先获取匹配对象，然后判断匹配对象是否非空，当非空时在使用group()、groups() 方法获取匹配结果。见实例2

(2)实例

例1

import re
print(re.match(r'How', 'How are you').span()) # 在起始位置匹配
print(re.match(r'are', 'How are you')) # 不在起始位置匹配

以上输出结果为：

  (0, 3) None

例2

　import re

　content = '577 zeke'

　result = re.match(r'[a-z]\d' , content)

　if result:

　　　print result.group()

　else:

　　　print 'No match!'

　以上执行结果如下：

　No match!

2.pattern.match方法

(1) 函数语法

　　pattern.match( string, pos=0, endpos=len(string))

　　函数作用：

　　　　这个方法将在字符串string的pos位置开始尝试匹配pattern（pattern就是通过 re.compile()方法编译后返回的对象），如果pattern匹配成功，无论是否达到结束位置endpos，都会返回一个匹配成功后的 Match对象；

　　　　如果匹配不成功，或者 pattern未匹配结束就达到endpos，则返回 None。

　　函数参数说明：

　　　　string：被匹配的字符串

　　　　pos：匹配的起始位置，可选，默认为0

　　　　endpos：匹配的结束位置，可选，默认为 len(string)

3. re.match和pattern.match区别

　　re.match方法与pattern.match()方法区别在于，它不能指定匹配的区间pos和endpos两个参数

search

1.re.search函数

re.search 扫描整个字符串并返回第一个成功的匹配，如果匹配失败search()就返回None。

(1)函数语法：

　 re.search(pattern, string, flags=0)

　　函数参数说明：

　　　　pattern 匹配的正则表达式

　　　　string 要匹配的字符串

　　　　flgs 标志位，用于控制正则表达式的匹配方式

　　我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

　　group(num=0) 获取匹配结果的各个分组的字符串，group() 可以一次输入多个组号，此时返回一个包含那些组所对应值的元组。

　　groups() 返回一个包含所有分组字符串的元组。

　　注意：如果未匹配成功，search()返回值为None，此时再使用group()、groups() 方法会报错。

　　　　应该先获取匹配对象，然后判断匹配对象是否非空，当非空时在使用group()、groups() 方法获取匹配结果。见实例2

(2)实例

例1

import re
print(re.search(r'How', 'How are you').span()) # 在起始位置匹配
print(re.search(r'are', 'How are you').span()) # 不在起始位置匹配

以上输出结果为：

  (0, 3) (4, 7)

例2

　import re
　content = 'Hi zeke,how old are you'
 
　result = re.search(r'\d+' , content)
　if result:
　　　print result.group()
　else:
　　　print 'No match!'
 
　rs = re.search(r'\w{4}' , content)
　if rs:
　　　print rs.group()
　else:
　　　print 'No match!'

　以上执行结果如下：

　No match!

　zeke

2.pattern.search方法

(1) 函数语法

　　pattern.search( string, pos=0, endpos=len(string))

　　函数作用：

　　　　如果匹配不成功，或者 pattern未匹配结束就达到endpos，则返回 None。

　　函数参数说明：

　　　　string：被匹配的字符串

　　　　pos：匹配的起始位置，可选，默认为0

　　　　endpos：匹配的结束位置，可选，默认为 len(string)

3. re.search和pattern.search区别

　　re.search方法与pattern.search()方法区别在于，它不能指定匹配的区间pos和endpos两个参数

4. re.match方法与re.search方法的区别

　　re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，并返货None；

　　re.search匹配整个字符串，直到找到一个匹配，如果整个字符串都没匹配到，则返回None。