python re(regular expression)模块

1.正则表达式:匹配字符串内容的一种规则。


2.re模块就是python用来做正则匹配的模块,下面介绍re模块常用的方法:

1.re.findall()

import re
#[a-z]+,匹配a-z中的字母,+:贪婪匹配(匹配前一个字符1次或无限次)
ret =re.findall('[a-z]+','eva egon yuan')
print (ret)#以列表形式返回值

[‘eva’, ‘egon’, ‘yuan’]


2.re.search()

  • 从前往后,找到一个就返回,返回的变量要用group才能拿到结果,如果没有找到,返回None,条用group会报错。
ret = re.search('a','eva egon yuan')
if ret:
    print (ret.group())

a


3.re.match()

  • match是从头开始匹配,如果正则规则从头开始可以匹配上,就返回一个变量。匹配的内用需要用group才能显示,如果没有匹配上会报错。
ret = re.match('e','eva egon yuan')
if ret:
    print (ret.group())

e


4.re.split()

#先按'a'分割,得到['','bcd'],然后对上面的结果按b分割,得到['','','cd']
ret = re.split('[ab]','abcd')
print (ret)

[’’, ‘’, ‘cd’]


5.re.sub()

#将数字替换成'H',参数2表示前2个数字,默认所有
ret = re.sub('\d','H','eva3egon4yuan4',2)
print (ret)

evaHegonHyuan4


6.re.subn()

扫描二维码关注公众号,回复: 10584739 查看本文章
#将数字替换成'H',并返回替换次数,以元组形式返回
ret = re.subn('\d','H','eva3egon4yuan4')
print (ret)

(‘evaHegonHyuanH’, 3)


7.re.compile()

obj = re.compile('\d{3}')
#将正则表达式编译成一个,正则表达式对象,规则匹配的是3个数字
ret = obj.search('abc123eee')
print (ret.group())

123


8.re.finditer()

#返回一个储存匹配结果的迭代器
ret = re.finditer('\d','ds3sy47825a')
print (ret)
print (next(ret).group())
print (next(ret).group())
print ([i.group() for i in ret])

<callable_iterator object at 0x00000288B5A420B8>
3
4
[‘7’, ‘8’, ‘2’, ‘5’]


参考链接:https://www.runoob.com/python3/python3-reg-expressions.html

发布了59 篇原创文章 · 获赞 8 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/Galen_xia/article/details/103748889