关于python正则表达式中匹配分组的问题 - 代码天地

关于python正则表达式中匹配分组的问题

其他 2018-11-16 22:10:43 阅读次数: 0

在爬取网页信息时，我们不妨会用到Python正则表达式。之前一直没有太明白关于正则表达式匹配分组的问题，今天终于搞清楚了，所以特意写一下让自己印象深刻。

myPage = requests.get(url).content.decode("gbk")

通过requests我们在网页得到了这样的html代码

我想对下面这一句通过正则表达式进行提取它的信息

使用正则表达式

mypage_Info = re.findall(r'<div class="titleBar" id=".*?"><h2>.*?</h2><div class="more"><a href="(.*?)">.*?</a></div></div>', myPage, re.S)

请注意上式的括号！

此时只有一个括号，最后我们只得到了一个匹配分组

可以看到得到了一个元素仅仅为网址的list，这是因为刚刚括号括到的地方只有网址，代表我们只有一个匹配分组。

这时我们将代码改写为

mypage_Info = re.findall(r'<div class="titleBar" id=".*?"><h2>(.*?)</h2><div class="more"><a href="(.*?)">.*?</a></div></div>', myPage, re.S)

仔细看的话会发现我在<h2>后面加上了括号，我在“移动”这样的文字出现的地方，建立了一个分组。

得到的结果是

可以看到现在我们得到的list，内部的元素已经变为了一个tuple。通过这个例子，应该就能说明这个正则表达式中这个“括号”的作用了。

猜你喜欢

转载自blog.csdn.net/yyhhlancelot/article/details/83351496

关于python正则表达式中匹配分组的问题

正则表达式补充--匹配分组

正则表达式06-匹配分组

正则表达式匹配分组操作示例

正则表达式匹配分组操作示例

python 正则表达式的用法re模块，match和search区别，匹配分组group

正则表达式（二）——进阶之匹配分组

正则表达式（re模块，匹配单个字符，匹配多个字符，匹配分组，python贪婪和非贪婪，r的作用）

三十四、正则表达式3：匹配分组（重点）以及 search、findall、sub、split方法介绍

正则表达式 | 关于正则表达式匹配密码问题

Python 基础之正则之二匹配分组,正则相关函数及表达式修饰符

通用正则表达式与python中的正则匹配

Python正则表达式：分组

Python 正则表达式（分组）

Python 正则表达式分组

Python中正则表达式对中文的匹配问题

关于Python正则表达式匹配0个或1个的问题

正则表达式在Python中的常用匹配字符

python中通用匹配网址的正则表达式

python中的正则表达式和匹配函数

Python 正则表达式匹配

Python 正则表达式，re模块，match匹配(默认从开头匹配)，分组

JS正则表达式的分组匹配

正则表达式分组与贪婪匹配

Java 正则表达式分组匹配

关于Python中的正则表达式

Python中关于正则表达式的使用

关于python正则表达式

python正则表达式入门，贪婪匹配和非贪婪匹配，正则表达式的分组，猫眼电影TOP100信息提取

Python中的正则表达式

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)