python爬虫(七)-------------------正则re模块 - 代码天地

python爬虫(七)-------------------正则re模块

其他 2019-04-03 10:11:12 阅读次数: 0

import re

m = re.match(r'\d{3}\-\d{3,8}', '010-12345')
# print(dir(m))
print(m.string)#打印匹配到的结果
print(m.pos, m.endpos)
'''
参考:
	https://www.cnblogs.com/tina-python/p/5508402.html
注：match和search一旦匹配成功，就是一个match object对象，而match object对象有以下方法：

group() 返回被 RE 匹配的字符串#参数代表正则表达式中的括号的位置
start() 返回匹配开始的位置
end() 返回匹配结束的位置
span() 返回一个元组包含匹配 (开始,结束) 的位置
group() 返回re整体匹配的字符串，可以一次输入多个组号，对应组号匹配的字符串。
'''

# 分组
m = re.match(r'^(\d{3})-(\d{3,8})$', '010-12345')#有两个括号
#与re.search()的区别
'''
m.groups():('010', '12345')
m.groups(0):010-12345
m.groups(1):010--------------------(\d{3})
m.groups(2):12345-------------------(\d{3,8})

'''
print(m.groups())
print(m.group(0))
print(m.group(1))
print(m.group(2))
'''
re.match()方法与pattern.match()方法区别:
re.match()不能指定匹配的区间pos和endpos两个参数，pattern.match可以



pattern = re.compile(r'hello')
pattern.match('hello world!')
以上两句等价于re.match(r”hello”,”hello world!”)
即re不用compile函数也能match

参考:
	https://www.cnblogs.com/xiaxiaoxu/p/9749655.html
'''

# 分割
p = re.compile(r'\d+')
print(type(p))
print(p.split('one1two3three3four4'))
print(m.group(2))

t = '20:15:45'
#括号用来分组,
re.match(r'^(0[0-9]|1[0-9]|2[0-3]|[0-9])\:(0[0-9]|1[0-9]|2[0-9]|3[0-9]|4[0-9]|5[0-9]|[0-9])\:(0[0-9]|1[0-9]|2[0-9]|3[0-9]|4[0-9]|5[0-9]|[0-9])$', t)
#打印分组结果
print(m.groups())

猜你喜欢

转载自blog.csdn.net/qq_41228218/article/details/88969742

python爬虫(七)-------------------正则re模块

python的正则——re模块

python正则re模块

Python(re模块,正则)

python 正则 re模块

Python正则、re模块

python的re模块（正则）

python爬虫re模块

PYTHON爬虫（正则re模块 | bs4 | pyquery）

【Python爬虫】正则表达式与re模块

python爬虫——re库（正则）

（python）正则之re模块

python - re正则匹配模块

python正则运算模块re

python之正则模块Re

python_正则_re模块

Python 正则处理_re模块

Python_re正则模块

re正则匹配模块_python

python之正则re模块

python—re模块与正则简介

python爬虫之re模块

python爬虫--re模块简介

Python笔记day18（模块）|正则匹配、爬虫例子、re模块

python常用模块之re模块（正则）

【笔记】Python基础七：正则表达式re模块

Python3网络爬虫——（5）正则表达式（re模块）

Python 从零开始爬虫(四):强大的正则表达式，re模块

Python爬虫之正则表达式和re模块

Python爬虫自学之第（④）篇——强大的正则表达式，re模块

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)