喜马拉雅爬取 - 代码天地

喜马拉雅爬取

其他 2019-01-24 00:05:03 阅读次数: 0

https://www.ximalaya.com/revision/play/album?albumId=11219907&pageNum=1&sort=-1&pageSize=30这个url找了好久，fo了。。。

点击全部播放按钮后出现右边箭头指的url，发现是个json格式的字符串，直接解析就ok了。

code：

import re
import requests
from bs4 import BeautifulSoup
import json

headers_1 = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.6824.400 QQBrowser/10.3.3127.400'
}

urls = []
for i in range(1,4):
    urls.append('https://www.ximalaya.com/revision/play/album?albumId=11219907&pageNum='+str(i)+'&sort=-1&pageSize=30')
x = 1
for u in urls:
    response = requests.get(u,headers = headers_1)
    html = response.text
    dic = json.loads(html)
    #print(type(dic['data']['tracksAudioPlay']))  list
    for content in dic['data']['tracksAudioPlay']:
        print(x,content['trackName'],'正在下载',content['src'])
        with open('E:\岳云鹏相声\%d%s.m4a' %(x,content['trackName']),'wb') as f:
            f.write(requests.get(content['src'],headers = headers_1).content)
        x += 1

猜你喜欢

转载自blog.csdn.net/qq_41333844/article/details/86530409

喜马拉雅爬取

python 爬取喜马拉雅

喜马拉雅说爬取音乐文件

practice之Python爬取喜马拉雅的音频

Python---喜马拉雅fm的音频爬取

类+进程池的方法爬取喜马拉雅

喜马拉雅全站音频爬取

喜马拉雅

喜马拉雅难登“喜马拉雅”

喜马拉雅-春秋

喜马拉雅FM

如何用Python爬取喜马拉雅全网音频文件

Python爬虫--喜马拉雅三国音频爬取

Python实例---爬取喜马拉雅全网音频文件

爬取喜马拉雅FM分类榜的代码分析

教你用python爬取喜马拉雅FM音频，干货分享~

Python爬取喜马拉雅有声小说【转载】

Python中使用requests和parsel爬取喜马拉雅电台音频

Python爬取喜马拉雅有声书

UESTC 1955 喜马拉雅山上的猴子

Python 爬取喜马拉雅音频

Python爬虫--喜马拉雅音频爬取

Python爬虫|爬取喜马拉雅音频

【python爬虫】对喜马拉雅上一个专辑的音频进行爬取并保存到本地

【Python3 爬虫学习笔记】爬取喜马拉雅《宝宝巴士-奇妙三字经》

python爬取喜马拉雅FM雪中悍刀行整本有声小说~

下载喜马拉雅工具洪校长音频

网易新闻APP、喜马拉雅APP数据接口

七天速成小程序——喜马拉雅

python爬虫-喜马拉雅_晚安妈妈睡前故事

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)