常用正则表达式:http://tool.chinaz.com/regex/
1、正则表达式:提供了一种在文本中灵活查找或匹配字符串模式的方法。单个表达式通常被称为regex。
2、python的re模块是用于将正则表达式应用到字符串上的库。含3个主题:模式匹配、替代、拆分。
3、为了在正则表达式中避免转义符\的影响,可以使用原生字符串语法,比如r'C:\x'或者'C:\\X'
4、match, search, findall
findall:返回的是字符串中所有的匹配项
search:返回的仅仅是第一个匹配项
match:更为严格,它只在字符串的起始位置进行匹配。
区别:
5、正则表达式方法总结
findall:将字符串中所有的非重叠匹配模式以列表形式返回。
finditer:与findall类似,但返回的是迭代器。
match:在字符串起始位置匹配模式,也可以将模式组建匹配到分组中;如果模式匹配上了,返回的一个匹配对象,否则返回None
search:扫描字符串的匹配模式,如果扫描到了返回匹配对象,与match方法不同的是,search方法的匹配可以是字符串的任意位置,而不仅仅是字符串的起始位置。
sqlit:根据模式,将字符串拆分为多个部分。
sub,subn:用替换表达式替换字符串中所有的匹配(sub)或第n个出现的匹配串(subn);使用符号\1,\2......来引用替换字符串中的匹配组元素。