python正则表达式特殊字符简要分析

python正则表达式特殊字符简要分析


1、^c :表示字符串必须以c开头

2、 . :表示任意字符

3、* :表示前面的字符可以重复任意多次

4、 $ :表示以什么结尾

5、? :非贪婪模式(从左向右匹配)

6、+ :表示加号前面的字符至少出现一次

7、 {1},{2,},{2,5} :表示前面的字符出现1次/两次或两次以上/最少2次最多5次

8、 | :表示或

9、 [48357] :表示可以是集合中的任何一个数值

10、 [0-9] :表示在0-9区间内

11、 [^1] :表示不等于1

12、 \s :表示空格

13、 \S :表示匹配单个任意字符

14、 \w :表示[A-Za-z0-9_](数字,字母,下划线)

15、 \W :表示与\w相反的

16、[\u4E00-\u9FA5] :unicode编码,匹配汉字

17、() :()内的内容表示的是一个子表达式

18、 \d :表示代表数字

    实例:检索出生年月日

# _*_ coding:utf-8 _*_
import re

line = "xxx出生于2001年6月1日"    #2001年6月1日
line = "xxx出生于2001/6/1"      #2001/6/1
line = "xxx出生于2001-6-1"      #2001-6-1
line = "xxx出生于2001-06-01"     #2001-06-01
line = "xxx出生于2001-06"       #2001-06

regex_str = ".*出生于(\d{4}[年/-]\d{1,2}([月/-]\d{1,2}[日]|[月/-]\d{1,2}|[月/-]$|$))"

match_obj = re.match(regex_str,line)
if match_obj:
    print(match_obj.group(1))

猜你喜欢

转载自blog.csdn.net/weixin_38477351/article/details/79407252
今日推荐