41 正则中匹配多个字符串匹配任意单个字符正则中使用字符串重复、可选和特殊字符

第三课 正则中匹配多个字符串

# 匹配多个字符串

# 择一匹配符号, | 
import re
s = 'Python|Ruby|Java|Swift'
m = re.match(s,'PythonRuby')
print(m)  # <re.Match object; span=(0, 6), match='Python'>

m = re.search(s, 'I love Python.')
print(m)  # <re.Match object; span=(7, 13), match='Python'>
m = re.search(s, 'I love Java.')
print(m)  # <re.Match object; span=(7, 11), match='Java'> 

----------------------------
第四课 正则中匹配任意单个字符

# 匹配任意单个字符
#  点(.):可以匹配任意单个字符
'''
   match('.ind','-ind')
   '\.ind'   'bind'
'''
import re

s = 'bin.'
m = re.match(s, 'binxa')
if m is not None:
    print(m.group())       # binx

m = re.search(s, '<bind>')
print(m.group())           # bind

s1 = '3.14'
s2 = '3\.14'  # 这个只能匹配 3.14
m = re.match(s1, '3.14')
print(m)                    # <re.Match object; span=(0, 4), match='3.14'>
m = re.match(s1, '3314')
print(m)                    # <re.Match object; span=(0, 4), match='3314'>

m = re.match(s2, '3.14')
print(m)                    # <re.Match object; span=(0, 4), match='3.14'>

m = re.match(s2, '3514')
print(m)                    # None
第五课  正则中使用字符串
主要针对单个字符有多个选择

#  [abcd]   表示   或者是a  或者是b 或者是c 或者是d

# 使用字符集
# [abcd]  abc|b|c|d
import re
m = re.match('[abcd]','a')
print(m)                # <re.Match object; span=(0, 1), match='a'>

print(re.match('a|b|c|d','a'))  # <re.Match object; span=(0, 1), match='a'>

print(re.match('[abcd]','ab'))  # <re.Match object; span=(0, 1), match='a'>
print(re.match('ab|cd','ab'))  # <re.Match object; span=(0, 2), match='ab'>

print(re.match('[ab][cd][ef][gh]','adfh')) # <re.Match object; span=(0, 4), match='adfh'>

print(re.match('[ab][cd][ef][gh]','abceh'))  # None

-------------------------
第六课  正则中重复、可选和特殊字符

# 重复、可选和特殊字符

'''
*:0到n  a* 空字符串 a aa  aaa     表示*修复的字符串 0到n次
+:1到n  a+  a  aa   aaa         表示+修复的字符串 1到n次 至少有一个
?:可选  a?  空字符串  a           表示修复的字符串可有可无 
'''
'''
匹配'a' 'b' 'c'三个字母按顺序从左到右排列,而且这3个字母都必须至少有1个
abc  aabc   abbbccc   bca(不匹配) 
'''
import re
s = 'a+b+c+'     # 同时满足 三个字母按顺序并且至少有1个 
strList = ['abc','aabc','bbabc','aabbbcccxyz']
for value in strList:
    m = re.match(s,value)
    if m is not None:
        print(m.group())
    else:
        print('{}不匹配{}'.format(value,s))
结果为:
abc
aabc
bbabc不匹配a+b+c+
aabbbccc

# 匹配前面任意3个数字-后面任意3个小写字母
'''
123-abc   543-xyz   1-xyz(不匹配)  xyz-123(不匹配)
[0-9]  表示任意一个数字 
\d    表示任意一个数字 
\d\d\d     任意3个数字 
[a-z]   任意一个小写字母 
[a-z][a-z][a-z]   任意3个字母
[A-Z]        任意一个大写字母 
{n}         
\d{3}       表示任意出现3此数字 
[a-z]{3}    表示一个出现3此字母
'''
print('-------------')
s = '\d{3}-[a-z]{3}'
strList = ['123-abc','456-xyz','1234-xyz','1-xyzabc','657-xyz^%abc']
for value in strList:
    m = re.match(s,value)
    if m is not None:
        print(m.group())
    else:
        print('{}不匹配{}'.format(value,s)) 

结果为:
123-abc
456-xyz
1234-xyz不匹配\d{3}-[a-z]{3}
1-xyzabc不匹配\d{3}-[a-z]{3}
657-xyz

'''
匹配以a到z的26个字母中的任意一个作为前缀(也可以没有这个前缀),后面至少有1个数字

'''
print('-------')
s = '[a-z]?\d+'
strList = ['1234','a123','ab456','b234abc']
for value in strList:
    m = re.match(s,value)
    if m is not None:
        print(m.group())
    else:
        print('{}不匹配{}'.format(value,s)) 

结果为:
1234
a123
ab456不匹配[a-z]?\d+
b234

'''
匹配email
\w   表示任意一个字符,包括小写的大写的字母和数字 也能匹配汉子 不包括连字符和特殊的字符
\w+   表示任意一个字符,包括小写的大写的字母和数字  至少有一个 不能为空
[a-zA-Z0-9] 表示:只能是字母小写大写和数字
'''
print('-------')
email = '\w+@(\w+\.)*\w+\.com'
emailList = ['[email protected]','[email protected]','[email protected]','[email protected]']
for value in emailList:
    m = re.match(email,value)
    if m is not None:
        print(m.group())
    else:
        print('{}不匹配{}'.format(value,email))

结果为:
[email protected]
[email protected]
[email protected]不匹配\w+@(\w+\.)*\w+\.com
[email protected]

strValue = '我的email是[email protected],请发邮件到这个email'
m = re.search(email,strValue)
print(m)  # <re.Match object; span=(0, 26), match='我的email是[email protected]'> 
email = '[a-zA-Z0-9]+@(\w+\.)*\w+\.com'
m = re.search(email,strValue)
print(m)  # <re.Match object; span=(8, 26), match='[email protected]'>
print(m.group())  # [email protected]

猜你喜欢

转载自blog.51cto.com/12445535/2465942