前端js对模拟浏览器爬虫的解决方案 - 代码天地

前端js对模拟浏览器爬虫的解决方案

其他 2021-03-19 17:11:00 阅读次数: 0

前端js对模拟浏览器爬虫的解决方案

我们在开发爬虫的过程中喜欢使用Selenium + Chromedriver，然后在前端中一行Javascript代码就可以识别出来，从而把你干掉

首先我们用一下代码启动模拟浏览器

from selenium.webdriver import Chrome

driver = Chrome()

如下图：

接下来我们用一行js代码来调试window.navigator.webdriver

返回的结果为ture

接下来咱们返回正常的浏览器进行查看，运行相同的代码，如下图所示

可以看到正常的浏览器为undefined,所以我们就知道了在一些网站会知道咱们的是模拟浏览器的，这只是其中的一种方法。

同样有影响的是咱们破解了某个网站的加密，在借助模拟浏览器进行解密的时候获取的加密数据不对，有一部分的原因就是对方在加密的时候对浏览器进行了判定，包括某乎的加密和某音的加密。

接下来我们来讲讲如何解决。

对js比较熟悉的同学们肯定会用下面这行代码进行解决

Object.defineProperties(navigator, {webdriver:{get:()=>undefined}});

如下图所示：
现在确实是解决了，但是我们在翻页的时候就行了

现在就又不行了，有种简单的方法，直接修改代码即可，在启动Chromedriver之前，为Chrome开启实验性功能参数excludeSwitches，它的值为['enable-automation']

from selenium.webdriver import Chrome

from selenium.webdriver import ChromeOptions

option = ChromeOptions()

option.add_experimental_option('excludeSwitches', ['enable-automation'])

driver = Chrome(options=option)

猜你喜欢

转载自blog.csdn.net/zyc__python/article/details/106690641

前端js对模拟浏览器爬虫的解决方案

前端常见的浏览器兼容性问题及解决方案

【前端】浏览器兼容问题及其解决方案

前端常见浏览器兼容性问题解决方案

Web前端浏览器兼容性问题及解决方案

浏览器显示海康摄像头实时预览画面纯前端解决方案

【前端兼容性】常见的浏览器兼容问题及解决方案

前端开发中常见的浏览器兼容性问题及解决方案

前端笔记 ---- Chrome 浏览器不能跨域访问解决方案

前端浏览器的兼容性问题探讨和解决方案

微信浏览器js选择默认浏览器，微信自动打开手机浏览器的解决方案

模拟浏览器js,有接口可用于爬虫

前端常见浏览器兼容性问题解决方案和前端异步(async)解决方案(所有方案)

浏览器主页被篡改最终解决方案

浏览器缓存问题原理以及解决方案

浏览器缓存问题解决方案

IE浏览器无法打开的解决方案

浏览器的跨域问题以及解决方案

阻止浏览器自动填充密码的解决方案

浏览器加载图片错误解决方案

thinkphp浏览器显示 Connection refused 解决方案。

浏览器同源策略，及跨域解决方案

浏览器兼容性问题及解决方案

谷歌浏览器崩溃的解决方案

火狐浏览器书签无法删除解决方案

浏览器兼容问题及解决方案

浏览器安全检查5秒解决方案

google chrome浏览器自动填充解决方案

浏览器的同源策略及跨域解决方案

JavaScript跨浏览器解决方案集合

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)