Python3爬虫2-正则与解析库

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/x15696576570/article/details/84844525

在完成了获取网页源代码后,就是爬虫的第二步解析并提取有用的数据。本文将介绍Python中强大而常用的正则表达式re模块,和三个常用的网页解析库lxml、Beautiful Soup、pyquery。

正则表达式

猜你喜欢

转载自blog.csdn.net/x15696576570/article/details/84844525