爬虫练习1

导入re包
match(”,string)
”中写正则表达式
match只匹配开始位置
只要匹配上一个就结束,无论字符串后面是否还有符合该表达式的
findall() 会匹配整个字符串
在正则表达式中
‘.’ 代表任意字符,不包括制表符,换行符
‘*’ 代表之前元素出现0次或者多次
‘+’ 代表之前元素出现至少1次
‘?’ 代表之前元素出现1次或者0次
‘.*’ 贪婪匹配
例子:’ “www.baidu.com” “www.baidu.com” ’
‘.*?’ 非贪婪匹配
{4}表示之前字符出现4次才符合规则

猜你喜欢

转载自blog.csdn.net/qq_43074872/article/details/82181223