python使用beautifulsoup4库爬取酷狗的付费榜 - 代码天地

python使用beautifulsoup4库爬取酷狗的付费榜

其他 2020-07-29 12:21:23 阅读次数: 0

-------- 已失效-------------------
声明：本文仅为技术交流，请勿用于它处。
小编经常在网上听一些音乐但是有一些网站好多音乐都是付费下载的正好我会点爬虫技术，空闲时间写了一份，会下载到当前目录，只要按照bs4库就好，
安装方法：pip install beautifulsoup4
完整代码如下：双击就能直接运行

from bs4 import BeautifulSoup
import requests
import re
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'
}
url='https://songsearch.kugou.com/song_search_v2?&page=1&pagesize=30&userid=-1&clientver=&platform=WebFilter&tag=em&filter=2&iscorrection=1&privilege_filter=0&_=1555124510574'
#想要爬取别的网页直接修改这个json数据地址就行
r=requests.get(url,headers=headers)
soup=BeautifulSoup(r.text,'lxml')
title_list=soup.select('.pc_temp_songlist ul li')
hash=re.findall(r',"FileHash":"(.*?)"',r.text)
hash1=re.findall(r',"FileName":"(.*?)"',r.text)
#直接用正则匹配隐藏的数据
print(hash)
print(hash1)
q=0
for url in hash:
    url_a=f'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery1910212680783679835_1555073815772&hash={url}&album_id=18784389'
    #这个URL不用修改的
    c=requests.get(url_a,headers=headers)
    a=c.text[40:-3]
    b=re.findall('"play_url":"(.*)","authors":',a)[0]
    b1=re.sub(r"\\",'',b)
    f = requests.get(b1)
    with open(hash1[q]+'.mp3','wb')as d:
        d.write(f.content)
    print(hash1[q])
    q+=1

爬取酷狗的唯一难点就是hash值的获取找了一个多小时才找到，比网易云好点就是自己不用写一个哈希值，酷狗是自己就存在的能找到，网易云是需要函数生成的。
以上所述是小编给大家介绍的python获取酷狗音乐top500的下载地址 MP3格，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持！

猜你喜欢

转载自blog.csdn.net/weixin_43927238/article/details/89527480

python使用beautifulsoup4库爬取酷狗的付费榜

python使用beautifulsoup4爬取酷狗音乐

Python 爬虫 BeautifulSoup4 库的使用

python基于beautifulsoup4爬取wallpaperup的壁纸

python爬虫——爬取酷狗音乐top500(BeautifulSoup使用方法)

python爬虫爬取酷狗音乐排行榜

python爬取酷狗音乐排行榜

python BeautifulSoup4库

爬取酷狗飙升榜

爬取酷狗酷狗飙升榜，爬虫案例

Python3.7 爬虫（三）使用 Urllib2 与 BeautifulSoup4 爬取网易云音乐歌单

【python 爬虫】BeautifulSoup4 库的介绍使用

Python网络爬虫——BeautifulSoup4库的使用

爬虫学习之4：BeautifulSoup爬取酷狗Top500歌曲

BeautifulSoup4库

【爬虫】002 python3 +beautifulsoup4 +requests 爬取静态页面

爬取实例-Python3.6，Xpath，BeautifulSoup4, 正则表达式

BeautifulSoup4 库的基本使用

【Python】【爬虫】爬取酷狗音乐网络红歌榜

Python爬取酷狗飙升榜前十首（100）首，写入CSV文件

【python】爬取酷狗音乐Top500排行榜【附源码】

爬取酷狗TOP_排行榜

python爬取酷狗排行音乐

从0开始学爬虫8使用requests/pymysql和beautifulsoup4爬取维基百科词条链接并存入数据库

Python爬虫实现使用beautifulSoup4爬取名言网功能案例

Beautifulsoup4库学习

Python:requests库、BeautifulSoup4库的基本使用（实现简单的网络爬虫）

（待整理）Python:requests库、BeautifulSoup4库的基本使用（实现简单的网络爬虫）

python3.7使用beautifulsoup4使用lxml解析库报错

python BeautifulSoup4的用法

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)