Python学习的第23天re、subprocess

一、re

1、重复匹配

（1）.:匹配换行符以外的任意一个字符
# print(re.findall('a.c','abc a1c aac asd aaaaac a*c a+c abasd')) #['abc','a1c','aac','aac','a*c','a+c']
#                                                        a.c
# print(re.findall('a.c','abc a1c aac a\nc asd aaaaac a*c a+c abasd',re.DOTALL))

（2）[]:匹配一个字符,该字符属于中括号内指定的字符
# print(re.findall('a..c','abc a1 c aac asd aaaaac a *c a+c abasd ='))
# print(re.findall('a.c','abc a1 c aac aAc aBc asd aaaaac a-c a/c a *c a+c abasd = a1c a2c'))
# print(re.findall('a[a-z]c','abc a1 c aac aAc aBc asd aaaaac a-c a/c a *c a+c abasd = a1c a2c'))
# print(re.findall('a[A-Z]c','abc a1 c aac aAc aBc asd aaaaac a-c a/c a *c a+c abasd = a1c a2c'))
# print(re.findall('a[-+*/]c','abc a1 c aac aAc aBc asd aaaaac a-c a/c a *c a+c abasd = a1c a2c'))
# print(re.findall('a[a-z][a-z]c','abc a1 c aac aAc aBc asd aaaaac a-c a/c a *c a+c abasd = a1c a2c'))
# print(re.findall('a[^a-z]c','abc a1 c aac aAc aBc asd aaaaac a-c a/c a *c a+c abasd = a1c a2c'))

（3）# *: 必须与其他字符连用，代表左侧最近的第一个字符出现0次或者无穷次
# print(re.findall('ab*','a ab abbb abbbb a1bbbb a-123'))
# ab*
#['a','ab','abbb','abbbb','a','a']
# print(re.findall('ab{0,}','a ab abbb abbbb a1bbbb a-123'))

（4）# ?：必须与其他字符连用,代表左侧最近的第一个的字符出现0次或者1次
# print(re.findall('ab?','a ab abbb abbbb a1bbbb a-123'))
# ab?
#['a','ab','ab','ab','a','a']
# print(re.findall('ab{0,1}','a ab abbb abbbb a1bbbb a-123'))

（5）# +：必须与其他字符连用,代表左侧的字符出现1次或者无穷次
# print(re.findall('ab+','a ab abbb abbbb a1bbbb a-123'))
# ab+
# ['ab','abbb','abbbb']
# print(re.findall('ab{1,}','a ab abbb abbbb a1bbbb a-123'))

（6）# {n,m}：必须与其他字符连用
# print(re.findall('ab{1,3}','a ab abbb abbbb a1bbbb a-123'))
# ab{1,3}
# ['ab','abbb','abbb']

2、

（1）.*：贪婪匹配
# print(re.findall('a.*c','ab123adfc1134124123adasfc123123'))

（2） .*?:非贪婪匹配
# print(re.findall('a.*?c','ab123adfc1134124123adasfc123123')

（3）():分组不影响匹配，但只会取（）内的内容，如果都要取（？：）
# print(re.findall('expression="(.*?)"','expression="1+2+3/4*5" egon="beautiful"'))
# expression=".*?"

# print(re.findall('href="(.*?)"','<p>段落</p><a href="https://www.sb.com">点我啊

（4）|竖杠表示左边或者右边

print(re.findall('a|b','ab123abasdfaf'))
#                        a|b
#取companies 或 company   

# print(re.findall('compan(?:ies|y)','Too many companies have gone bankrupt, and the next one is my company'))

PS：re匹配识别的流程：先pythin识别一次字符串，re再识别一次字符串

比如我们要把a\c匹配出来，而\本身又是转译，实际要写成a\\\\c才能

3.re、search()从左到右匹配，找到一个就结束

print(re.findall('ale(x)','alex is SB,alex is bigSB'))
print(re.search('alex','alex is SB,alex is bigSB'))
print(re.search('ale(x)','alex is SB,alex is bigSB').group())
print(re.search('abcdefg','alex is SB,alex is bigSB'))

4、re.match() 只能从头开始匹配，第一个不是就返回None

 print(re.search('^alex','123alex is SB,alex is bigSB'))
# print(re.match('alex','123alex is SB,alex is bigSB'))

5、re.split()切割

# l='egon:18:male'.split(':')
# print(l)
# l1=re.split('[ :/-]','a-b/c egon:18:male xxx')
# print(l1)

6、re.sub()替代

re.sub(‘原‘，‘新’，‘内容’，次数）次数可不写，默认全部替换

 print(re.sub('[a-z]+xx','yxp','lxx is good,sb is lllxx wxx is good cxx is good')

7、re.compile()预存一个正则表达式可以重复使用

# pattern=re.compile('alex')
# print(pattern.findall('alex is SB,alex is bigSB'))
# print(pattern.search('alex is SB,alex is bigSB'))

Python学习的第23天re、subprocess

猜你喜欢