Python实现Splash爬取网页 - 代码天地

Python实现Splash爬取网页

其他 2018-09-29 18:16:59 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_38038143/article/details/82379051

先开启splash:

sudo docker run -p 8050:8050 scrapinghub/splash

.py代码:

import requests
from urllib.parse import quote
from requests import ConnectionError
lua = '''
function main(splash)
    splash:go("https://www.baidu.com")
    input = splash:select("#kw")
    input:send_text("Python")
    submit = splash:select("#su")
    submit:mouse_click()
    splash:wait(3)
    return splash:jpeg()
end
'''
#将lua脚本转换为url格式并与url地址拼接
url = "http://localhost:8050/execute?lua_source=" + quote(lua)
try:
    #请求url
    response = requests.get(url)
    print(response.status_code)
    #将返回的信息写入文件
    with open('baidu.jpg', 'wb') as f:
        f.write(response.content)
except ConnectionError as e:
    print(e)

其中: lua为lua语言编写的脚本, url中execute为splash中的API.

结果:

这里写图片描述

猜你喜欢

转载自blog.csdn.net/qq_38038143/article/details/82379051

Python实现Splash爬取网页

Python如何快速实现爬取网页？

python爬取网页

win10安装docker(配置国内镜像加速)并实现scrapy通过splash爬取动态网页

python动态爬取网页

Python 爬虫爬取网页

Python爬取网页图片

Python爬取网页title

python爬取网页（简易）

python 爬取静态网页

python爬取网页信息

Python爬取网页内容

【python】爬取网页图片

python爬取简单网页

python爬取网页视频

Python 爬虫学习03 具体爬取网页的实现

爬虫之scrapy和splash 结合爬取动态网页

Python - Python 简单爬取网页内容

Python网络爬虫实现HTTP请求、解析网页和数据存储（简单静态网页爬取）

nodeJs 实现爬取网页信息

几种网页爬取的方法与实现(Java)

node实现网页内容的爬取

java代码实现网页源码爬取

java-实现网页代码的爬取

node轻松实现网页爬取功能

python根据标签爬取网页信息

python爬取网页基本框架

python爬取网页的通用代码框架

python 爬取网页新浪新闻

python获取网页精准爬取数据

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)