学习Python 十九 (正则表达式)

15.8 正则表达式

正则表达式也叫做匹配表达式,它是由一串特定的字符组成的,一般用于查找(替换),匹配字符
import re

[‘A’, ‘ASCII’, ‘DEBUG’, ‘DOTALL’, ‘I’, ‘IGNORECASE’, ‘L’, ‘LOCALE’, ‘M’, ‘MULTILINE’, ‘Match’,
‘Pattern’, ‘RegexFlag’, ‘S’, ‘Scanner’, ‘T’, ‘TEMPLATE’, ‘U’, ‘UNICODE’, ‘VERBOSE’, ‘X’, ‘MAXCACHE’, ‘all’,
‘builtins’, ‘cached’, ‘doc’, ‘file’, ‘loader’, ‘name’, ‘package’, ‘spec’, ‘version’, ‘cache’, ‘compile’,
‘compile_repl’, ‘expand’, ‘locale’, ‘pickle’, ‘special_chars_map’, ‘_subx’, ‘compile’, ‘copyreg’, ‘enum’,
‘error’, ‘escape’, ‘findall’, ‘finditer’, ‘fullmatch’, ‘functools’, ‘match’, ‘purge’, ‘search’, ‘split’,
‘sre_compile’, ‘sre_parse’, ‘sub’, ‘subn’, ‘template’]

compile findall split finditer search sub match

match() ------------ 从头开始匹配
在这里插入图片描述

15.8.1 元字符

\d -------------------- 匹配数字
. --------------------- 匹配的是任意符号(除了\n)
\w ---------------- 匹配所有的有效符号(大小写字母,数字,下划线,各国语言符号)
\s ------------------- 匹配的是空白位(空格 \t(四个空格))
^ ------------------- 以xxxx开头 例如:以1开头 ^1
$ ------------------ 以xxx结尾
[ ] -------------------- 列举 [0123456789]等价于\d [a-z] [A-Z] [A-Z a-z]
在这里插入图片描述

15.8.2 反义符

\D -------------- 不是数字
\W ------------ 特殊符号
\S --------------- 非空白位
[^] ------------------- 列举反义 注意:[^] 和 1 的区别

15.8.3 转义符

在python中字符串\ 表示的特殊含义 如果要表示一个正常\ 需要两个
在这里插入图片描述
建议大家写正则表达式的时候要加上r

15.8.4位数

.* ----------------- 表示的是匹配任意位(可以0位,可以是1位…)
±------------------表示的是至少一位(最少就要一位,可以n位)
?----------------- 0位或者是1位
{n,} ----------------- 至少n位
{n,m} ------------------ 表示n-m范围

15.8.5分组(group)

在正则表达式里面,使用()将正则包裹起来,会形成正则进行二次筛选
在这里插入图片描述
去掉html里面的标签:r"</?.+?>"


  1. ↩︎

おすすめ

転載: blog.csdn.net/weixin_53002381/article/details/116430196