菜鸟的python正则表达式学习过程 - 代码天地

菜鸟的python正则表达式学习过程

其他 2020-04-24 11:04:54 阅读次数: 0

一.正则基本概念：
1.
\d ——匹配数字;
\w ——匹配数字+字母
\b ——匹配单词的便捷
\s ——匹配空格符
[特殊字符] ——匹配特殊字符
2.
+——匹配至少一个字符
* ——匹配任意个字符
? ——匹配0或者1个字符
{n} ——匹配n个字符
{n,m} ——匹配n-m个字符
3.
[] ——表示精确匹配
| ——表示or的意思
^ ,$ ——分别表示行的开始和结束

二.python中的正则相关的函数，可查看菜鸟教程：
https://www.runoob.com/python/python-reg-expressions.html

re.match(【正则表达式】，【待匹配的字符串】)，返回值是object对象
eg： import re
//r" xxx"的表达式python中常用的正则的表达方式，不是必须的但是使用更加友好
re.match(r’^\d{3}-\d{3,8}$’, ‘010-12345’)
输出：<_sre.SRE_Match object; span=(0, 9), match=‘010-12345’>
切分字符串
re.split(r’\s+’, ‘a b c’)
输出：[‘a’, ‘b’, ‘c’]
分组，用()表示的就是要提取的分组（Group）。比如：
^(\d{3})-(\d{3,8})$分别定义了两个组，可以直接从匹配的字符串中提取出区号和本地号码：group(0)永远是原始字符串，group(1)、group(2)……表示第1、2、……个子串。
m = re.match(r’^(\d{3})-(\d{3,8})$’, ‘010-12345’)
m.group(0)
输出：‘010-12345’
findall（r’ xxx’，s） ——s字符串中符合正则表达式的子串

三、贪婪模式和非贪婪模式
贪婪模式是从后往前匹配，匹配不上就去掉字符串最后一位，直到匹配成功；
非贪婪模式也叫作懒惰模式，从前往后匹配，一旦匹配成功就停止；
eg：s = ababaaba
p1 = r’\a.b’
贪婪模式匹配结果：ababaab
非贪婪模式匹配结果：ab

四、练习题

验证email地址
def is_valid_email(addr):
addr_ex = re.compile(r’[0-9a-zA-Z._\s]+[@][0-9a-zA-Z._]’)
if addr_ex.match(addr):
return True
else:
return False

//测试:
assert is_valid_email(‘[email protected]’)
assert is_valid_email(‘[email protected]’)
assert not is_valid_email(‘bob#example.com’)
assert not is_valid_email(‘[email protected]’)
print(‘ok’)
匹配一行文字中的所有开头的字母内容
s1 = “i love you not because of who you are, but because of who i am when i am with you”
content = re.findall(r"\b\w", s1)
print (content)

//匹配一行文字中的所有开头的数字内容
s2=“i love you not because 12sd 34er 56df e4 54434”
content2 = re.findall(r’\b\d’,s2)
print(content2)
#将以下网址提取出域名：
s = “”“http://www.interoem.com/messageinfo.asp?id=35`
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=377&id=6
http://www.fincm.com/newslist.asp?id=415"”"
p = r’(http://.+?/).+’
print(re.sub(p,lambda x :x.group(1),s))
提取出如下字符串中的单词：
s = “hello world ha ha”
p = r’\s+’
print(re.split(p,s))
print(re.findall(r’\w+’,s))

华晔

发布了24 篇原创文章 · 获赞 0 · 访问量 2061

私信关注

猜你喜欢

转载自blog.csdn.net/Poppy_tester/article/details/104995725

菜鸟的python正则表达式学习过程

【菜鸟教程笔记】Python正则表达式

菜鸟编程-python-正则表达式

Python正则表达式学习

Python学习-正则表达式

python学习—正则表达式

Python学习：正则表达式

python 正则表达式学习

Python 学习 —— 正则表达式

python学习正则表达式

python 学习【正则表达式】

python学习正则表达式

python学习正则表达式

Python学习—— 正则表达式

Python正则表达式的学习

【python】正则表达式的学习

【Python学习】正则表达式

Python学习--正则表达式

【正则表达式】正则表达式及python的re模块学习

python正则表达式学习（2）-网易邮箱的正则表达式

Python学习：13.Python正则表达式

Python学习笔记|Python之正则表达式

Python学习笔记-Python 正则表达式

python学习笔记——正则表达式regex

Python学习笔记十七：正则表达式

Python学习笔记十五：正则表达式

Python学习笔记__11章正则表达式

python学习记录2—正则表达式

python 正则表达式学习1

Python学习笔记之正则表达式

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)