python使用无界面浏览器htmlunit干活 - 代码天地

python使用无界面浏览器htmlunit干活

其他 2019-04-11 20:31:28 阅读次数: 0

最近想获取亚马逊的一些cookie信息，之前采用scrapy来获取的cookie信息可以获取的不多，刚刚开始还可以用，后面太多失效的，还是使用selenium跑一遍cookie发现完美的成活率。但是有一个问题，太消耗资源，而且放在服务器也不好搭环境，就想着使用htmlunit来干活，又省资源，又快速加载东西，啧啧啧，干活啦。

首先你电脑要安装java环境 jdk，安装java之后，我们一般会在https://www.seleniumhq.org这个官网下载我们需要的se服务器

这个是下载好之后的：

然后我们执行以下代码：

java -jar selenium-server-standalone-3.141.59.jar

然后开始执行操作htmlunit

from selenium import webdriver
driver = webdriver.Remote("http://ip地址:4444/wd/hub", webdriver.DesiredCapabilities.HTMLUNIT.copy())

然后很愉快的会出现下面的错误，不管你是在win还是linux上面，两个平台我都尝试过，有问题

于是最后，不断地找问题，最后在github找到相关信息，selenium官网上面下载的服务器不能使用，这里我们用github上面的jar，这边下载：https://github.com/sveneisenschmidt/selenium-server-standalone/tree/master/bin

然后此时，我们在执行

java -jar selenium-server-standalone.jar -port 4448

然后在执行

from selenium import webdriver
driver = webdriver.Remote("http://localhost:4448/wd/hub", desired_capabilities=webdriver.DesiredCapabilities.HTMLUNIT)

然后发现可以啦

或者可以使用网址：http://localhost:4448/wd/hub/static/resource/hub.html监控

还好我有专研精神，终于解决啦！

猜你喜欢

转载自www.cnblogs.com/zhe-hello/p/10692153.html

python使用无界面浏览器htmlunit干活

使用python的Selenium启动chromedriver，无界面浏览器

无界面浏览器

无界面浏览器访问网页，python

python+selenium 浏览器无界面模式运行

【python】简单使用selenium编写无界面谷歌浏览器的网页登录和签到功能

爬虫之——无界面浏览器

Python selenium 启动浏览器有无界面执行

python操作无界面的chrome浏览器无头模式

使用无界面浏览器实现豆瓣电影的异步加载

selenium操作无界面chrome浏览器

PhantomJS快速入门-无界面浏览器

selenium-设置chrome浏览器无界面模式

selenium操作Firefox无界面浏览器

java浏览器无界面后台截屏工具

selenium 浏览器无界面模式运行

selenium phantomjs java无界面浏览器环境搭建

设置 chrome 无头浏览器无界面执行

【selenium】无界面浏览器使用代理IP

HtmlUnit 模拟浏览器以及Cookie使用示例

selenium+python自动化：centos上搭建selenium启动chrome浏览器headless无界面模式

使用Selenium 测试工具和PhantomJS无界面浏览器结合，简单实现对百度的访问

python3 + selenium + 无界浏览器

使用phantomjs无界浏览器截图

模拟浏览器的神器 - HtmlUnit

selenium设置（有界面/无界面浏览器）下载文件路径

{转载保存}selenium+java使用方法及无界面浏览器使用

无界面浏览器（自动化测试、爬虫适用）

selenium无界面操作浏览器与Chrome Options的启动项设置

利用协程框架，无界面浏览器爬取上海高院开庭数据

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)