re 正则语法 - 代码天地

re 正则语法

其他 2021-10-08 22:11:52 阅读次数: 0

1. 逗号分割，忽视引号中的逗号

r ：原始字符串
, ：以逗号分割
\s ：匹配空白字符
*：匹配前一个字符0次或者无数次，当出现：,,，匹配结果：''，即空字符
(?![^"]*\"\,)：匹配"AAA",中的逗号，不匹配AAA",中的逗号，在以逗号分割的时候，忽略双引号中的逗号

问题：当字符串尾部也有双引号时，双引号内的逗号会被分割
方法：字符串后面加上,
参考来源：https://www.jianshu.com/p/d5ae083ff35d

a = '2020-03-04, "wuhan, hubei, china", covid-19 raged'
b = re.split(r',\s*(?![^"]*\"\,)', a)
# ['2020-03-04', '"wuhan, hubei, china"', 'covid-19 raged']

2. 提取文本中的数字、英文、中文

0-9：数字
A-Za-z：英文
\u4e00-\u9fa5：中文

a = '2020年春节时，covid-19开始肆虐'
b = re.sub('[^0-9,.]+', '', a)

c = re.sub('[^\u4e00-\u9fa5]+', '', a)
# 年春节时开始肆虐

3. 提取两个词之间的文本

两个词仅在文本中出现一次
两个词在文本中出现多次，例如LEFT出现2次，希望截取最后一次出现的位置到RIGHT之间的文本

a = '关于江西省航空护林局直升机机场建设项目环境评估报告政府采购项目（采购编号：JXZC2017-03-G008）竞争性谈判公告'
b = re.findall(r'(?<=局).*?(?=采购)', a)
# 直升机机场建设项目环境评估报告政府

a1 = '民航运行管理中心和气象中心工程及情报管理中心工程配套家具采购项目'
b1 = re.findall(r'(?<=工程)((?:(?!工程).)*?)(?=采购)', a1)
# 配套家具

4.提取两个符号之间的文本

re的语法中（、“具有特定的含义，如果希望其作为一般含义的符号使用，需要在前面加上\，即\(、\"

a = '$("#pubtime_baidu").html(_formatTime(new Date("2020-08-31 09:59:30").getTime()+600*1000));'
b = re.findall(r'(?<=new Date\(\").*?(?=\"\))', a)
# 2020-08-31 09:59:30

猜你喜欢

转载自blog.csdn.net/shlhhy/article/details/107459340

re 正则语法

python语法_模块_re(正则表达)

python中re模块正则语法小结

RE正则

正则-re

re 正则

正则re

python正则表达式re模块语法

re模块语法—python正则表达式

复习&正则&re模块

python re正则

python的正则——re模块

正则re模块

python正则re模块

【python】【re】正则匹配

Python 正则 RE

RE模块正则

正则（re 模块）

re正则的分组序号

re模块（详解正则）

正则和re模块

Python(re模块,正则)

正则 re模块

常用的re正则

正则匹配模块re

re模块与正则

re模块和正则

正则与re模块

正则法则 re模块

python 正则 re模块

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)