小白学爬虫笔记12---正则表达式-Re库的Match方法&最小匹配 - 代码天地

小白学爬虫笔记12---正则表达式-Re库的Match方法&最小匹配

其他 2018-08-28 00:08:43 阅读次数: 0

re库的match对象

match = re.search(r'[1-9]\d{5}','BIT 100081')
if match:
    print (match.group(0))
type(match) # <class '_sre.SRE_Match'>

Match对象的属性

.string 待匹配的额文本
.re 匹配时使用的pattern对象（正则表达式）
.pos 正则表达式搜索文本的开始位置
.endpos 正则表达式搜索文本的结束位置

Match对象的方法

.group(0) 获取匹配后的字符串
.start() 匹配字符串在原始字符串的开始位置
.end() 匹配字符串在原始字符串的结束位置
.span() 返回（.start(),.end())

m.string # 'BIT100081 TSU100084'
m.re # re.compile('[1-9]\\d{5}')
m.pos # 0
m.endpos # 19
m.group(0) # '100081'
m.start() # 3
m.end() # 9
m.span() # (3,9)

Re库的贪婪匹配与最小匹配

match= re.search(r'PY.*N','PYANBNCNDN')
match.group(0) # 'PYANBNCNDN'

贪婪匹配

Re库默认采用贪婪匹配，即输出匹配最常的子串

输出最短子串

match = re.search(r'PY.*?N','PYANBNCNDN')
match.group(0) # 'PYAN'

最小匹配操作符

*？前一个字符0次或无限次扩展，最小匹配
+？前一个字符1次或无限次扩展，最小匹配
？？前一个字符1次或0次扩展，最小匹配
{m,n}? 扩展前一个字符m至n次（含n），最小匹配

猜你喜欢

转载自blog.csdn.net/paleyellow/article/details/81506265

小白学爬虫笔记12---正则表达式-Re库的Match方法&最小匹配

小白学爬虫笔记11---正则表达式-Re库

python爬虫的re库（正则表达式匹配）

浅析正则表达式匹配方法 match()

Python 正则表达式，re模块，match匹配(默认从开头匹配)，分组

Python爬虫--- 1.4 正则表达式：re库

Python爬虫速成------正则表达式及re库

Python爬虫速成------正则表达式及re库

网络爬虫：Re库与正则表达式

python爬虫学习笔记6：正则表达式及re库

【python爬虫学习笔记】06 正则表达式以及Re库入门

Python爬虫学习笔记(正则表达式基础：Re库)

Python爬虫学习笔记(补充：正则表达式基础：Re库)

三十二、(重点)正则表达式1：re模块（re.match、group()）、正则表达式单字符匹配、正则数量（{m}、{m,n}）

小白学爬虫笔记10---正则表达式入门

python 正则表达式re库相关笔记

正则表达式re库学习笔记

re正则表达式方法

re正则表达式笔记

re.match()正则表达式

正则表达式2--re方法--match()--search()

【Python3 爬虫学习笔记】基本库的使用 12—— 正则表达式 5

正则表达式 preg_match 匹配中文

java正则表达式 match find匹配位置

用正则表达式匹配（match）正整数

python re正则表达式:字符类匹配

python re正则表达式:设定匹配次数

正则表达式（re.compile/re.match/re.split用法）

python 正则表达式的用法re模块，match和search区别，匹配分组group

正则表达式最大匹配与最小匹配

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)