简单学会python正则表达式

一前言
本篇文章带大家快速入门正则表达式的使用,正则表达式的规则不仅适用python语言,基本大多数编程语言都适用,在日常使用中极为广泛,读者们有必要学好正则表达式。看完这篇文章,读者们要理解什么是正则表达式,正则表达式的规则,常见的正则表达式示例,如何在python中使用函数进行正则表达式操作;

二 正则表达式的概念
正则表达式是指在一串字符串中使用特殊的模式匹配获得子串,我们可以对获得的子串进行提取,替换等操作;

举个例子zszxz666 这个字符串,现在知识追寻者想要获得子串zszxz, 则需要经过一个模式匹配后获得子串,在正则表达式中这个模式可以很多种格式,知识追寻者在这边使用最简单的模式 [a-z]*,然后经过python正则表达式匹配函数就可以获得子串zszxz;这种方式比平时的字符串函数操作更加简便,适用范围广泛;

三 常用的正则匹配模式
常用的正则表达式模式如下,如果对这些模式有疑惑的可以参照 正则表达式手册 ;手册中还有日常使用的正则示例,比如用户名,密码,邮箱,URL 的匹配模式等;

模式 含义
^ 匹配字符串的开头
$ 匹配字符串的末尾
. 匹配任意字符,除了换行符
+ 匹配前面的子表达式一次或多次
? 匹配前面的子表达式零次或一次,或表示一个非贪婪限定符
* 匹配前面的子表达式零次或多次
\ 转义特殊字符
\d 匹配任意数字,等价于 [0-9]。
\D 匹配任意非数字
\s 匹配任意空白字符(制表,换行,回车,换页,垂直制表),等价于[^\f\n\r\t\v]
\S 匹配任何非空白字符。等价[^\f\n\r\t\v]
\w 匹配数字字母下划线
\W 匹配非数字字母下划线
[…] 用来表示一组字符;[amk] 匹配 ‘a’,‘m’或’k’
[^…] 不匹配在[]中的字符;[^amk]不匹配 ‘a’,‘m’或’k’
{n} 匹配前面的子表达式n 次
{n,} 匹配前面的子表达式至少n 次
{n,m} 匹配前面的子表达式最少匹配 n 次且最多匹配 m 次
| 表示或;a| b,表示匹配a或者b
\b 匹配一个单词边界,即字与空格间的位置
\B 非单词边界匹配
四 python正则常用修斯符
re.I 使匹配对大小写不敏感
re.L 做本地化识别(locale-aware)匹配
re.M 多行匹配,影响 ^ 和 $
re.S 使 . 匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解
五 python常用正则行数说明
pattern 表示正则表达式模式
string 表示传入待匹配字符串
flags 标志位,可以用第四节的修饰符限定
count 表示限定匹配的次数
repl 表示替换的字符串,也可为一个函数
pos 起始位置
endpos 结束位置
maxsplit 最大分割次数
函数名称 函数含义
re.findall(string, pos, endpos) 匹配所有子串,并返回一个列表,未匹配,则返回空列表
re.match(pattern, string, flags=0) 从字符串的起始位置匹配一个模式,如果匹配失败返回None
re.search(pattern, string, flags=0) 扫描整个字符串并返回第一个成功的匹配;匹配失败返回None
re.compile(pattern, flags=0) 编译正则表达式,生成一个正则表达式( Pattern )对象
re.sub(pattern, repl, string, count=0, flags=0) 查找和替换
re.finditer(pattern, string, flags=0) 与findall类似,返回的是迭代器
re.split(pattern, string, maxsplit=0, flags=0]) 将匹配的子串分割后返回列表


————————————————
版权声明:本文为CSDN博主「知识追寻者」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/youku1327/article/details/103935686

猜你喜欢

转载自www.cnblogs.com/LQZ888/p/12188264.html