喜马拉雅-春秋 - 代码天地

喜马拉雅-春秋

其他 2018-08-17 16:57:43 阅读次数: 0

import requests
from lxml import etree
from urllib import parse


url = 'https://www.ximalaya.com/lishi/4164479/'

headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
}

response = requests.get(url, headers=headers)

# with open('chunqiu.html', 'wb') as f:
#     f.write(response.content)

html_str = response.text
# print(html_str)
html_ele = etree.HTML(html_str)
# print(html_ele)
li_list = html_ele.xpath('//ul[@class="dOi2"]/li')
# print(li_list)
for li_ele in li_list:
    # print(li_ele)
    li_href = li_ele.xpath('./div[2]/a/@href')[0]
    # print(li_href)

    url_list = parse.urljoin(url, li_href)
    # print(url_list)

    url_a = url_list.split('/')[-1]
    # print(url_a)
    url_b = 'https://www.ximalaya.com/revision/play/tracks?trackIds='+ str(url_a)
    # print(url_b)

    response_a = requests.get(url_b, headers=headers)

    json_a_dict = response_a.json()
    # print(json_a_dict)

    src_a_str = json_a_dict['data']['tracksForAudioPlay'][0]['src']
    trackName_a = json_a_dict['data']['tracksForAudioPlay'][0]['trackName']

    from urllib import request
    request.urlretrieve(src_a_str,trackName_a+'.ma4')

　　

猜你喜欢

转载自www.cnblogs.com/gxsmm/p/9494140.html

喜马拉雅-春秋

喜马拉雅

喜马拉雅难登“喜马拉雅”

喜马拉雅FM

喜马拉雅爬取

python 爬取喜马拉雅

下载喜马拉雅工具洪校长音频

网易新闻APP、喜马拉雅APP数据接口

七天速成小程序——喜马拉雅

UESTC 1955 喜马拉雅山上的猴子

python爬虫-喜马拉雅_晚安妈妈睡前故事

喜马拉雅单个无版权下载

喜马拉雅说爬取音乐文件

practice之Python爬取喜马拉雅的音频

Swift仿写喜马拉雅FM

Python---喜马拉雅fm的音频爬取

Python爬虫 -- 喜马拉雅爬虫01

如何在电脑上安装喜马拉雅FM？

重命名从喜马拉雅下载的音频文件

音频喜马拉雅学习平台怎么样？

类+进程池的方法爬取喜马拉雅

喜马拉雅情迷英音表达

七天速成小程序--喜马拉雅

android拷贝喜马拉雅节目到music目录

喜马拉雅全站音频爬取

TypeScript仿喜马拉雅开发APP

喜马拉雅如何正序播放

ReactNative+TypeScript仿喜马拉雅开发App

从喜马拉雅听下载音频文件

喜马拉雅的音乐怎么批量下载？

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)