Python中re模块的使用

re.match

在字符串的开始位置匹配,如果匹配成功将返回MatchObject(值为True),否则返回None(值为False)。 
函数原型

def match(pattern, string, flags=0)

参数说明

pattern:正则表达式
string:要匹配的字符串
flags:控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等

re.search

检测整个字符串,找到第一个匹配项,如果匹配成功将返回MatchObject(值为True),否则返回None(值为False)。 
函数原型

def search(pattern, string, flags=0)

参数说明

pattern:正则表达式
string:要匹配的字符串
flags:控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等

re.sub

将字符串中的匹配项替换为其他 
函数原型

def sub(pattern, repl, string, count=0, flags=0)

参数说明

pattern:正则表达式,匹配被替换的项
repl:替换为该项
string:要匹配的字符串
count:替换的个数,默认为0时表示全部替换

re.split

根据匹配项来分割字符串 
函数原型

def split(pattern, string, maxsplit=0, flags=0)

参数说明

pattern:正则表达式
string:要匹配的字符串
maxsplit:最大的分割次数,默认为0时表示全部分割

re.findall

获取字符串中的所有匹配项 
函数原型

def findall(pattern, string, flags=0)

参数说明

pattern:正则表达式
string:要匹配的字符串

re.compile

把正则表达式(以字符串书写的)编译成一个模式对象,提高一定的匹配效率,可用来重复使用 
函数原型

def compile(pattern, flags=0)

参数说明

pattern:正则表达式

实例展示

 # -*- coding: UTF-8 -*-

import re

if __name__ == '__main__':
    # 正则判断
    str1 = 'sfadasasefa'
    regex = re.compile('^[a-z]+$')
    flag = regex.search(str1)
    if flag:
        print 'YES'
    else:
        print 'NO'

    # 正则判断
    str2 = 'adfasfasdf'
    flag = re.match('\w+', str2)
    if flag:
        print 'YES'
    else:
        print 'NO'

    # 分组
    str3 = '465746adfa685796'
    obj = re.search('([0-9]+)([a-z]+)(\d+)', str3)
    if obj:
        print obj.group(1),' ', obj.group(2)
    else:
        print 'No match'

    # re.sub
    c = re.sub(u"测试", u"【测试】", text)
    d = re.sub(u"测试", u"【测试】", text, count=1) 
    print c, "\n", d

    # re.split
    e = re.split(u"。", text)
    print "\n".join(e)
    f = re.split(u"(。)", text)
    print "\n".join(f)

    # 分离电话号码
    str4 = '[email protected]哈哈娿'
    regex = re.compile('((?:(?:13[0-9])|(?:15[^4,\D])|(?:18[0,2,5-9]))\d{8})')
    print regex.findall(str4)

猜你喜欢

转载自blog.csdn.net/jenrey/article/details/81012193