python基础|模块---re模块

  python中的re模块是正则技术中应用。对于正则就是正则表达式,正则表达式是独立一门技术,在各个编程体系都有它的“身影"。在python中在爬虫技术中,数据分析,它都是必不可少的存在。主要利用正则表达式筛选字符串中我们需要的字符串类型数据。

  正则表达式基础知识。元字符和量词。

元字符

匹配作用

.

可以匹配除换行符以外的任何字符

\w

匹配字母,数字和下滑线

\d

匹配除了数字

\s

匹配空格

\W

匹配非字母,数字和下划线

\D

匹配非数字

\S

匹配非空格

^

匹配^字符串开头。用法(^a:匹配a开头的字符串)

$

匹配$字符串结尾。用法(a$:匹配字符串a结尾)

\n

匹配换行符

\t

匹配一个制表符

\b

匹配单词的结尾

()

匹配括号内的表达式,也表示一个组

[…]

匹配字符组中的字符

[^….]

匹配除了字符组中的所有字符

a|b

匹配a或b字符

猜你喜欢

转载自www.cnblogs.com/huaiXin/p/11201825.html