网络爬虫(微博热搜榜单)

这次运用所学的知识尝试了爬取微博的热搜榜单,部分操作在程序的注释中给出思路

首先我们打开微博热搜的网站,并查看其源代码,如图

 通过查找并观察可以看出,热搜的关键词就在<tr>标签的名为<td-02>的子标签下的<a>标签中

以此为基础完成如下代码,部分讲解在代码的注释中

 执行结果如下(得到的是当前热搜榜单,不同时刻可能不同)

 本次内容的难点主要在对网页源代码信息的解析,在理清楚网页源代码,并找到自己需要的内容后,结合所需知识便可顺利完成

猜你喜欢

转载自www.cnblogs.com/nihilist/p/12823747.html