爬虫正则表达式

正则表达式:

.  匹配除换行符以外的任意字符
\w 匹配字母或者数字或下划线
\s 匹配任意的空白符
\d 匹配数字
\n 匹配一个换行符
\t 匹配一个制表符
^  匹配字符串的开始 匹配是否以某个字符串开头
$  匹配字符串的结尾
\W 匹配非字母或数字或下划线
\D 匹配非数字
\S 匹配非空白符
a|b 匹配字符a或字符b
() 匹配括号内的表达式,也表示一个组  \数字 进行使用
[....] 匹配字符组中的字符
[^....] 匹配除了字符组中字符的所有字符

量词:控制前面的元字符出现的次数
* 左邻重复零次或更多次
+ 左邻重复一次或更多次
? 重复零次或一次
{
    
    n} 左邻重复n次
{
    
    n,} 左邻重复n次或更多次
{
    
    n,m} 左邻重复n到m次

.*   贪婪匹配
.*?  惰性匹配

| 分隔符 匹配两个不同的字符串

猜你喜欢

转载自blog.csdn.net/xuanyitwo/article/details/131109176