1分钟轻松爬数据（web scraper插件使用教程）

其他 2019-06-20 14:51:55 阅读次数: 0

1分钟轻松爬数据（web scraper插件使用教程）

前提你已安装web scraper(Google，FireBox商店都有)。
说明：安装后右键查看元素或检查即可看到web scraper，简介如图.
在这里插入图片描述刚开始只能点第一个（显示你自己建的要爬的所有网站）和第三个（可以创建或导入）
(导入可以查看网站http://www.iwebscraper.com/category/%e6%a8%a1%e6%9d%bf/)

建一个sitemap
建好后点击你建的sitemap就可以创建你要抓去的数据了
3. 这个时候创建一个获取所有元素。
选择元素

后面就可以创建需要的数据了。我只写一个

这就完了。
最简单就是导入
例子

{"_id":"keepallcourses","startUrl":["https://www.gotokeep.com/all_courses/"],"selectors":[{"id":"element","type":"SelectorElementScroll","parentSelectors":["_root"],"selector":"li","multiple":true,"delay":"2000"},{"id":"name","type":"SelectorText","parentSelectors":["element"],"selector":"div.name","multiple":false,"regex":"","delay":0},{"id":"classnumber","type":"SelectorText","parentSelectors":["element"],"selector":"span:nth-of-type(1)","multiple":false,"regex":"","delay":0},{"id":"bodypart","type":"SelectorText","parentSelectors":["element"],"selector":"span:nth-of-type(2)","multiple":false,"regex":"","delay":0},{"id":"difficult","type":"SelectorText","parentSelectors":["element"],"selector":"div.level","multiple":false,"regex":"","delay":0},{"id":"apparatus","type":"SelectorText","parentSelectors":["element"],"selector":"div.equipment","multiple":false,"regex":"","delay":0},{"id":"trainnumber","type":"SelectorText","parentSelectors":["element"],"selector":"div.pioneer","multiple":false,"regex":"","delay":0}]}

在这里插入图片描述》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》
第一次写就这这样吧！
有关webscraper的问题，看这个就够了https://www.jianshu.com/p/cd5124ac0871
web scraper 抓取分页数据和二级页面内容https://www.cnblogs.com/fengzheng/p/9328481.html

猜你喜欢

转载自blog.csdn.net/weixin_42829146/article/details/86645115

1分钟轻松爬数据（web scraper插件使用教程）

【Web Scraper教程04】Web Scraper插件的selector理解

【Web Scraper教程02】安装Web Scraper插件

【Web Scraper教程05】(含视频演示)Web Scraper爬虫爬取"58同城数据"

不用写代码的爬虫：使用chrome浏览器的爬虫插件Web Scraper爬取天猫商品信息

Web Scraper_2_使用

【Web Scraper教程03】(含动画演示)Web Scraper爬虫爬取"p2p数据平台"

1分钟学会使用Tor代理教程

网页数据抓取工具（谷歌插件 web Scraper）

使用web scraper抓取分页内容

Web Scraper基本使用和概念_1.2

Asp.Net Core 轻松学-10分钟使用EFCore连接MSSQL数据库

RuiJi Scraper 网页数据提取插件快速上手

使用TuShare下载历史逐笔成交数据并生成1分钟线

【Web前端】5分钟掌握画布元素的使用

【Web前端】5分钟掌握画布元素的使用

Eclipse教程1 - 3分钟理清Maven依赖

Swagger初次使用（1分钟使用swagger）

10分钟轻松搞定SpringBoot集成Activiti6教程

mac新手教程：十分钟轻松熟悉操作Mac系统

网站常见问题1分钟定位 - 如何使用阿里云ARMS轻松重现用户浏览器问题

1分钟掌握 ViaBus 架构的使用

1分钟使用frp实现内网穿透

使用Hugo，只需5分钟，轻松搭建一个自己的博客

Web Scraper的windows下CouchDB的安装使用_3.3

零代码爬虫神器 -- Web Scraper 的使用

5分钟爬虫教程：如何用 Python 爬一些微电影？

【Web Scraper教程01】理解网页数据抓取的原理（含演示）

小白5分钟上手c#数据库操作(三) 使用VisualStudio 1分钟快速完成一张表增删改查

【谷歌插件爬虫实战】零基础不会代码想学爬虫？不用编写代码的图形界面化爬虫Web Scraper参上！——基于Google的扩展应用程序插件Web Scraper爬取B站全站榜TOP100

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)