涉及嵌套分组与命名分组的正则练习一则

编程语言 2019-02-28 19:23:34 阅读次数: 0

涉及嵌套分组与命名分组的正则练习一则

转载请注明出处：https://blog.csdn.net/jpch89/article/details/88022328

文章目录

涉及嵌套分组与命名分组的正则练习一则

1. 题目
2. 使用嵌套分组
3. 使用命名分组

1. 题目

有文本若干行如下，请写出正则匹配出以 param 开头的参数信息，输出格式为：字段名称、字段类型（不带尖括号）、是否可选（不带尖括号）和字段含义四部分内容。

"""
#param  nickname    <str>    昵称
#param  sex    <int>    <可选>    学员性别，1 男，2 女
"""

2. 使用嵌套分组

分析

第一条记录没有 <可选>，而第二条记录有 <可选>，所以要把 <可选> 整体作为一个分组进行匹配，然后在里面嵌套一个分组，匹配去掉尖括号的内容。
假如作为整体的那个分组的编号为 n，里面嵌套的分组的编号分别为 n + 1、n + 2、n + 3 等等。

代码

import re

text = """
#param  nickname    <str>    昵称
#param  sex    <int>    <可选>    学员性别，1 男，2 女
"""

# 使用嵌套分组
p = re.compile(r'#param\s+([a-zA-Z]+)\s+<([a-zA-Z]+)>(\s+<(.+)>)?\s+(.+)')
result = p.finditer(text)
for i in result:
    print(i.group(1, 2, 4, 5))

"""
('nickname', 'str', None, '昵称')
('sex', 'int', '可选', '学员性别，1 男，2 女')
"""

补充

经验：正则匹配写的越严格越好，比如 str 的匹配尽量写成 '[a-zA-Z]+'，而不要写成 '.+'，不然容易多匹配到其它的东西。
group 函数的帮助文档

Help on built-in function group:

group(...) method of re.Match instance
    group([group1, ...]) -> str or tuple.
    Return subgroup(s) of the match by indices or names.
    For 0 returns the entire match.

group 函数说明
- 只传递一个参数时，返回相应分组的匹配结果
- 传递多于一个参数时，返回由匹配结果组成的元组
- 接收的参数可以是数字或者字符串名称

3. 使用命名分组

分析

上面使用嵌套分组的方法，虽然成功匹配到了所有信息，但是调用 group 函数时传入的分组编号容易出错，尤其是在有嵌套分组存在的情况下。
为了改善这一弊端，可以使用命名分组。
命名分组的写法是 (?P<分组名>要匹配的内容)。
在正则表达式中可以通过 (\数字) 来引用之前匹配到的分组。
有了命名分组之后，可以在正则表达式中使用 (?P=name) 来匹配之前匹配到的命名分组。

代码

import re

text = """
#param  nickname    <str>    昵称
#param  sex    <int>    <可选>    学员性别，1 男，2 女
"""

# 使用命名分组
p = re.compile(r'#param\s+(?P<name>[a-zA-Z]+)\s+<(?P<type>[a-zA-Z]+)>(\s+<(?P<opt>.+)>)?\s+(?P<desc>.+)')
result = p.finditer(text)
for i in result:
    print(i.group('name', 'type', 'opt', 'desc'))

"""
('nickname', 'str', None, '昵称')
('sex', 'int', '可选', '学员性别，1 男，2 女')
"""

完成于 2019.02.28

猜你喜欢

转载自blog.csdn.net/jpch89/article/details/88022328

涉及嵌套分组与命名分组的正则练习一则

golang正则之命名分组

命名分组(?<name>....)

正则表达式——命名分组

D21_4.1_命名分组

git技巧一则：git重命名分支

Django路由系统---django重点之url命名分组

Django路由系统---url无命名分组

RegExp-named captured groups(命名分组捕获)

Day24 正则表达式正则函数正则命名分组正则表达式修饰符号

Django之无名分组，有名分组

无名分组和有名分组

nginx go gin按域名分组

elasticsearch嵌套对象分组

分组(recyclerview嵌套)

django基础之有名分组和无名分组

分组（命名）匹配

正则分组和捕获

【正则】分组/捕获-总

Python 正则 —— 捕获与分组

re正则的分组序号

正则替换分组

正则表达分组

正则匹配分组

js正则分组&引用

C++正则分组

分组

Django学习之路由配置和有名分组

9.7 路由的简单配置，有名分组

分组查询--小结练习

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)