催大佬正则表达式讲解

版权声明: https://blog.csdn.net/djs123DJS/article/details/83118937

  正则表达式:有些网页用常用的解析库是解析不了的,所以要用正则表达式。非结构化,无规律的网页一般用正则。

正则表达式出现括号的话,第一个括号就是group(1),第二个就是group(2)。把想匹配的东西用括号括起来,在配置左端点右端点,就可以匹配出来了。

pattern = re.compile('<li.*?cover.*?href="(.*?)".*?title="(.*?)".*?more-meta.*?author">(.*?)</span>.*?year">(.*?)</span>.*?</li>',re.S)
results = re.findall(pattern,content)

猜你喜欢

转载自blog.csdn.net/djs123DJS/article/details/83118937
今日推荐