爬虫利器JavaScript渲染服务Splash的使用 - 代码天地

爬虫利器JavaScript渲染服务Splash的使用

其他 2021-01-31 10:35:59 阅读次数: 0

简介

Splash是一个使用Twisted和QT5在Python 3中实现的支持HTTP API调用的轻量级的web浏览器，它使用Twisted和QT的反射机制以使服务完全异步并通过QT主循环以便利用webkit并发性，能提供JavaScript渲染服务。

Splash 的主要功能:

支持并行处理多个页面
支持获取返回的HTML代码或者获取返回页面的截屏图片
可以通过禁止图片加载或者使用Adblock Plus插件来提高加载页面的速度
在页面的上下文中执行用户的JavaScript代码
编写lua脚本来操作浏览器
在Splash-Jupyter中支持lua脚本
在格式化的HAR 数据中获取渲染的相关细节

安装

centos + dockeer

下载并安装 docker
拉取镜像:
```
sudo docker pull scrapinghub/splash
```
启动容器:
```
docker run -d -p 8050:8050 --memory=4.5G --restart=always scrapinghub/splash:3.1 --maxrss 4000 --slots 50 --max-timeout 3600
```
–memory=4.5G 指的是 docker 在启动这个容器时可以使用的最大内存值。
–restart=always 崩溃后自动重启。
–maxrss 4000 指的时候 splash 进程最多能使用内存，默认单位是M。
–slots 50 并发线程数，当同时请求数超过配置的线程数量时，请求会进去队列等待，超时时间是从spalsh收到请求之后开始计算的，所以如果请求进入队列等待，在队列里等待的时间也会被算在超时等待内。
–max-timeout 3600 最大超时时间，单位是秒。
测试是否启动：curl http://localhost:8050/_ping

猜你喜欢

转载自blog.csdn.net/qq_20116223/article/details/113172220

爬虫利器JavaScript渲染服务Splash的使用

Splash 基础使用 JavaScript渲染爬虫

爬虫中使用Splash渲染js

小白学 Python 爬虫（39）： JavaScript 渲染服务 scrapy-splash 入门

Scrapy爬虫框架（实战篇）【Scrapy框架对接Splash抓取javaScript动态渲染页面】

javascript动态加载的网页，需要splash渲染引擎，下载docker

scrapy框架使用splash渲染引擎爬取动态页面

Splash 渲染引擎简介

Scrapy框架Splash渲染

Splash的使用

使用 Splash

爬虫利器pyquery使用介绍

java爬虫利器Jsoup的使用

Splash动态页面爬虫

爬虫，工具 - Splash

Facebook Splash 登录爬虫

掌握前端利器：JavaScript页面渲染高阶方法解析与实战

爬虫怎样解决JavaScript渲染问题

Python爬虫利器之解析库的使用

爬虫之scrapy-splash

爬虫利器Scrapy框架：2:使用runspider运行爬虫

[Python3网络爬虫开发实战] 7.2-Splash的使用

python爬虫Scrapy框架笔记分享12-Splash 的使用

爬虫中主要用解决JavaScript渲染问题

记录------scrapy-splash爬虫相关

爬虫之Splash对象方法（五）

Python3中beautifulsoup库的使用(爬虫利器)

Python3中PyQuery的使用(爬虫利器）

第09讲：爬虫解析利器 PyQuery 的使用

Splash

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)