python3爬虫如何使用pyExecJS解析js代码 - 代码天地

python3爬虫如何使用pyExecJS解析js代码

其他 2019-10-27 11:29:31 阅读次数: 0

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/weixin_43886133/article/details/93488008

网络爬虫难免会遇到JS加密，当遇到比较难搞得JS加密时，很多小伙伴会选择使用selenium+Chrome,
但是selenium有时候未必是万能的，特别是浏览器在headless会出现一些不好解决的BUG，最关键的是效率！
如果selenium 无法解决但是又必须获取这些数据，破解JS势在必行 execjs是python很好的一个执行js的工具

下面看看基本的用法

环境

pyExecJs
Node.js

安装

pip install pyExecJs
apt-get install nodejs # ubuntu

使用

下面是使用execjs解析银监会的第一层解析

import execjs
import requests
import re


url = 'http://www.cbrc.gov.cn/zhuanti/xzcf/get2and3LevelXZCFDocListDividePage//1.html'
resp_body = requests.get(url).text
get_js = re.findall(r'<script>(.*?)</script>', resp_body)[0]

print(get_js)
get_js = re.sub(r'eval\(','return(', get_js)
resHtml = "function getClearance(){" + get_js + "};"
ctx = execjs.compile(resHtml)
temp = ctx.call('getClearance')
print(temp)

两次print的结果有比较大的差异

如果对银监会数据感兴趣可以留言交流

猜你喜欢

转载自blog.csdn.net/weixin_43886133/article/details/93488008

python3爬虫如何使用pyExecJS解析js代码

python3执行js之pyexecjs

Python使用pyexecjs代码案例解析

爬虫必备：Python 执行 JS 代码 —— PyExecJS、PyV8、Js2Py

python 执行js PyExecJS

Python3爬虫（七）解析库的使用之pyquery

python3爬虫(6)--使用Beautiful Soup解析数据

Python执行JS -- PyExecJS库

python3爬虫(4)--使用XPath解析数据（27种典型的爬虫匹配用法）

python3简单爬虫代码

最简单的爬虫代码（Python3）

【Python3 爬虫学习笔记】解析库的使用 10 —— 使用pyquery 3

【Python3 爬虫学习笔记】解析库的使用 5 —— Beautiful Soup 3

【Python3 爬虫学习笔记】解析库的使用 3 —— Beautiful Soup 1

【Python3 爬虫学习笔记】解析库的使用 11 —— 使用pyquery 4

【Python3 爬虫学习笔记】解析库的使用 9 —— 使用pyquery 2

【Python3 爬虫学习笔记】解析库的使用 8 —— 使用pyquery 1

【Python3 爬虫学习笔记】解析库的使用 2 —— 使用XPath 2

【Python3 爬虫学习笔记】解析库的使用 1 —— 使用XPath 1

Python3 爬虫使用代理 IP

Python3爬虫urllib使用介绍

Python3爬虫requests使用

Python3爬虫urllib库的使用

Python3爬虫-贴吧爬虫代码

Python3爬虫-贴吧爬虫代码

python3爬虫(3)--解析json数据

Python3爬虫（六）解析库的使用之Beautiful Soup

[Python3网络爬虫开发实战] 4-解析库的使用

【Python3 爬虫学习笔记】解析库的使用 7 —— Beautiful Soup 5

【Python3 爬虫学习笔记】解析库的使用 4 —— Beautiful Soup 2

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)