pyppeteer 使用教程 - 代码天地

pyppeteer 使用教程

其他 2019-06-20 20:13:08 阅读次数: 0

1 安装模块 pip install pyppeteer

2 初次调用

import asyncio
from pyppeteer import launch

async def main():
    browser = await launch({'headless': False,'dumpio':True, 'autoClose':False,'args': ['--no-sandbox', '--window-size=1366,850']})
    page = await browser.newPage()
    await page.setViewport({'width': 1366, 'height': 768})
    await page.goto('http://www.baidu.com')
    # await page.screenshot({'path': 'example.png'})   截屏
　　
    await browser.close()

asyncio.get_event_loop().run_until_complete(main())


# 第一次调用  会开始下载需要的插件工具  ，如果设置成无头浏览器，可能会报超时的错误

3 常用的属性以及方法

title = await  page.title()   #   获取标题 
print(title)
cookie = await page.cookies()   # 获取cookie ， 字典形式
print(cookie)
targe  =  page.target    # 暂时不清楚
print(targe)
cov = await  page.content()   # 获取渲染后网页的内容
print(cov)

4 选择器

使用 page.querySelector如果没有找到指定的对象，则返回None，而不是抛出异常。不管规范不规范，反正比selenium爽多了。

5 避免反爬，可在加载页面之前注入js代码

在page.goto(xxxx) 前加入以下代码

page.evaluateOnNewDocument(
    """ var _navigator = {};
        for (name in window.navigator) {
            if (name != "webdriver") {
                _navigator[name] = window.navigator[name]
            }
        }
        Object.defineProperty(window , 'navigator' ,{
            get : () => _navigator,
        })
    """
)

6 缺点，当程序中涉及到点击某个标签的话，可能将进程卡死

7 用于爬虫，效率有待验证

猜你喜欢

转载自www.cnblogs.com/chenxiyuxiao/p/11060949.html

pyppeteer 使用教程

pyppeteer模块的基本使用

pyppeteer——简单使用示例

pyppeteer基本使用demo

pyppeteer 使用案例

Pyppeteer

python pyppeteer使用笔记

爬虫的新模块pyppeteer的使用

pyppeteer的一些使用

使用pyppeteer登陆淘宝

使用pyppeteer调用puppeteer访问页面

python-pyppeteer模块使用汇总

python爬虫神器Pyppeteer入门及使用

python爬虫神器Pyppeteer入门及使用

第18讲：爬虫神器 Pyppeteer 的使用

使用pyppeteer爬取淘宝商品

【Python自学笔记】pyppeteer的使用方法

当使用pyppeteer报出如下错误时pyppeteer.errors.BrowserError: Browser closed unexpectedly

小爬爬4:12306自动登录&&pyppeteer基本使用

pyppeteer从基本使用到启发式爬虫

使用pyppeteer突破淘宝selenium检测实现登陆

Python|Pyppeteer实现持久化使用cookie的方法(19)

【centos7+docker运行报错】当使用pyppeteer报出如下错误时pyppeteer.errors.BrowserError: Browser closed unexpectedly

pyppeteer入门

python网络爬虫——Pyppeteer Pyppeteer

使用pyppeteer 绕过selenium检测，实现淘宝登陆（￥53）

网络爬虫之使用pyppeteer替代selenium完美绕过webdriver检测

爬虫利器Pyppeteer的介绍和使用爬取京东商城书籍信息

动态网页爬取：使用Selenium和Pyppeteer处理动态加载内容

pyppeteer爬虫例子

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)