Python中re模块的使用

re.match

在字符串的开始位置匹配，如果匹配成功将返回MatchObject（值为True），否则返回None（值为False）。
函数原型

def match(pattern, string, flags=0)

参数说明

pattern：正则表达式
string：要匹配的字符串
flags：控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等

re.search

检测整个字符串，找到第一个匹配项，如果匹配成功将返回MatchObject（值为True），否则返回None（值为False）。
函数原型

def search(pattern, string, flags=0)

参数说明

pattern：正则表达式
string：要匹配的字符串
flags：控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等

re.sub

将字符串中的匹配项替换为其他
函数原型

def sub(pattern, repl, string, count=0, flags=0)

参数说明

pattern：正则表达式，匹配被替换的项
repl：替换为该项
string：要匹配的字符串
count：替换的个数，默认为0时表示全部替换

re.split

根据匹配项来分割字符串
函数原型

def split(pattern, string, maxsplit=0, flags=0)

参数说明

pattern：正则表达式
string：要匹配的字符串
maxsplit：最大的分割次数，默认为0时表示全部分割

re.findall

获取字符串中的所有匹配项
函数原型

def findall(pattern, string, flags=0)

参数说明

pattern：正则表达式
string：要匹配的字符串

re.compile

把正则表达式（以字符串书写的）编译成一个模式对象，提高一定的匹配效率，可用来重复使用
函数原型

def compile(pattern, flags=0)

参数说明

pattern：正则表达式

实例展示

 # -*- coding: UTF-8 -*-

import re

if __name__ == '__main__':
    # 正则判断
    str1 = 'sfadasasefa'
    regex = re.compile('^[a-z]+$')
    flag = regex.search(str1)
    if flag:
        print 'YES'
    else:
        print 'NO'

    # 正则判断
    str2 = 'adfasfasdf'
    flag = re.match('\w+', str2)
    if flag:
        print 'YES'
    else:
        print 'NO'

    # 分组
    str3 = '465746adfa685796'
    obj = re.search('([0-9]+)([a-z]+)(\d+)', str3)
    if obj:
        print obj.group(1),' ', obj.group(2)
    else:
        print 'No match'

    # re.sub
    c = re.sub(u"测试", u"【测试】", text)
    d = re.sub(u"测试", u"【测试】", text, count=1) 
    print c, "\n", d

    # re.split
    e = re.split(u"。", text)
    print "\n".join(e)
    f = re.split(u"(。)", text)
    print "\n".join(f)

    # 分离电话号码
    str4 = '[email protected]哈哈娿'
    regex = re.compile('((?:(?:13[0-9])|(?:15[^4,\D])|(?:18[0,2,5-9]))\d{8})')
    print regex.findall(str4)

Python中re模块的使用

re.match

re.search

re.sub

re.split

re.findall

re.compile

猜你喜欢