python 爬虫 使用正则表达式获取文本

#正则表达式获取文本的规则与用法

import re

#编辑一个规则
reg = re.compile('is')
#要使用规则进行提取的文本
str1 = 'he is jack'

#检测str1内有没有is
result = re.search(reg,str1)
print(result)

#findall()返回结果,列表形式
print(re.findall(reg,str1))

#贪婪模式,它会将所有符合条件的都包含进去直到最后一个

reg2=re.compile('a\w*b')
str2='a123b456b789b'
result=re.findall(reg2,str2)
print(result)

#非贪婪模式

reg3=re.compile('a\w*?b')
result2=re.findall(reg3,str2)
print(result2)

猜你喜欢

转载自blog.csdn.net/qq_40243365/article/details/83002928
今日推荐