python3.6.4爬取裁判文书网----------基本js逆向解析----玉米都督

如果您觉得我的文章对您有用,请您给我一个关注,您的每一个关注都是对我极大的支持,我也会极大的提高产出效率,To_share_code

裁判文书网:http://wenshu.court.gov.cn/

这个政府网站垃圾慢,需要耐心

ps: 其实没必要关心js函数的内部细节,只要找到函数的输入输出点就可以了。

万变不离其宗,只要在 输入、输出的地方下断点,得到处理的结果,就算函数再复杂也不用怕。

随便搜索一个关键字:捆绑交易纠纷 

弹出很多条判决数据

这样的一般是在 js 或者XHR中,,  打开chrome,调试, 果不其然:::

没有假数据,  继续下一步.

看一下这个post 请求的  ajax  form data :

扫描二维码关注公众号,回复: 3999249 查看本文章

其中 vl5x   guid  像是加密的 所以我们需要找到这两个参数是怎么加密的  硬肛起来!!!!!

ctrl+shift+f  全局搜索 :   vl5x

我们看到  getKey()    guid1分别是两个加密参数的value

找到getKey()

:浅显易懂  return result   (真是亲民的反爬虫,爱你!!!)

再看guid1:

...emmmmmmmmmmmm

搞定!!!!!!!!!!!!!

另外还有详情页ID   下会分解,

总之 这个网站适合js反爬入门

猜你喜欢

转载自blog.csdn.net/qq_39443687/article/details/82734684