Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘 - 代码天地

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

其他 2018-06-11 16:02:46 阅读次数: 2

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

点击它，再点击右边的【Cookies】就可以看到请求头里的 cookie 情况。

cookie分析

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

除了上面说到的两个 cookie ，其他的请求头参数可以参照手动转存时抓包的请求头。这两个 cookie 预留出来做参数的原因是 cookie 都是有生存周期的，过期了需要更新，不同的账号登录也有不同的 cookie 。

参数分析

接下来分析参数，点击【Cookies】右边的【Params】查看参数情况。如下：

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

爬取shareid、from、filelist，发送请求转存到网盘

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

以上面这个资源链接为例（随时可能被河蟹，但是没关系，其他链接的结构也是一样的），我们先用浏览器手动访问，F12 打开控制台先分析一下源码，看看我们要的资源信息在什么地方。控制台有搜索功能，直接搜 “shareid”。

定位到4个shareid，前三个与该资源无关，是其他分享资源，最后一个定位到该 html 文件的最后一个标签块里。双击后可以看到格式化后的 js 代码，可以发现我们要的信息全都在里边。如下节选：

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

可以看到这两行

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

yunData.FILEINFO 结构如下，你可以将它复制粘贴到json.cn里，可以看得更清晰。

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

清楚了这三个参数的位置，我们就可以用正则表达式进行提取了。代码如下：

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

爬取到了这三个参数，就可以调用之前的 transfer 方法进行转存了。.

进群：125240963即可获取源码下载地址哦！

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

猜你喜欢

转载自www.cnblogs.com/PY2578/p/9167407.html

Python爬虫为何可以这么叼？爬取百度云盘资源！并保存到自己云盘

python爬虫：爬取百度云盘资料，保存下载地址、链接标题、链接详情

【Python】python爬取百度云网盘资源-源码

python爬取百度云网盘资源-源码

Python爬虫实战：抓取并保存百度云资源

百度网盘爬虫（如何爬取百度网盘）

百度云盘

如何同步更新保存百度云盘群组文件库好友文件库资源

用python爬取全网百度网盘资源的神器

神级python码农教你爬取并保存百度云资源，你懂得~

《扶摇》全集百度云网盘资源

卖百度云盘资源的微信号

找个百度云盘资源的微信号

卖百度云盘资源账号_Hhome

有卖百度云盘资源吗

谁卖百度云网盘资源-Home

基于selenium爬取图片并转存到百度网盘

基于python的百度云网盘资源搜索引擎设计架构

python3爬虫（5）百度云盘暴力破解尝试

用Python导出百度云盘文件目录

Python教程百度云全集网盘分享

Python爬取并闪存微信群里的百度云资源

百度云盘不限速

linux安装百度云盘

百度云盘下载办法

百度云盘VIP会员

百度云盘demo

Python爬虫实战：抓取并保存百度云资源（附代码）

【百度云盘】不开会员也可高速下载网盘资源！

求个卖百度云盘115网盘资源的微信号

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)