GooSeeker爬虫入门教程

  1. 直接搜索下载并注册(一定要注册)gooseeker,傻瓜式安装后打开
    在这里插入图片描述

  2. 在顶上搜索栏出输入想爬取的网站,此处以爬取2345天气网

    http://tianqi.2345.com/today-57516.htm
    

    在这里插入图片描述

  3. 点击ms谋数台
    在这里插入图片描述

  4. 输入需要爬取的网址,后按回车,等待网页加载完毕
    在这里插入图片描述
    在这里插入图片描述

  5. 点击弹出工作台,如果工作台未关闭的就跳过该步
    在这里插入图片描述
    在这里插入图片描述

  6. 创建命令规则并查重,直到不重复为止。
    在这里插入图片描述
    显示可用即可
    在这里插入图片描述

  7. 创建规则
    在这里插入图片描述
    点击新建
    在这里插入图片描述
    输入名字确定即可
    在这里插入图片描述
    创好之后如下
    在这里插入图片描述

  8. 右键点击之前的名字→添加→包容,并命名你想爬取的内容,随后在之前添加好的那个上添加,其后
    在这里插入图片描述
    定义好后点击第一个并勾选上关键内容
    在这里插入图片描述

  9. 点击你想爬取的内容并在网页标签中找到text在谋数台中查看是否是需要的属性,是就在text处右键点击并内容映射,选择对应的名称标记即可
    在这里插入图片描述

  10. 点击tianqi勾选启用,如果出现问题,就按照之前的步骤检查
    在这里插入图片描述

  11. 使用样例复制我们需要爬取的排行榜结构都是一样的,我们上一步只是完成了第一名数据的抓取,想要抓取更多的评论就需要进行样例复制。

找到包含整个数据的标签右键点击依次选择第一个第二个

在这里插入图片描述
结果如图
在这里插入图片描述
12. 点击测试,获取结果,
在这里插入图片描述

发布了85 篇原创文章 · 获赞 158 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/Late_whale/article/details/104567814