python网络爬虫-爬取云音乐评论（3） - 代码天地

python网络爬虫-爬取云音乐评论（3）

企业开发 2022-08-08 01:09:26 阅读次数: 0

「这是我参与11月更文挑战的第3天，活动详情查看：2021最后一次更文挑战」

经过前两天对爬虫基础的学习，今天来小试牛刀一下。爬一下网易云的评论。

1.定位位置目标

先找一首我最喜欢的歌《黄金时代》，但是没有原唱的，网易云真的是啥歌原唱都没有，翻唱一大堆！！

可以看出所有评论都是包裹在id为id="auto-id-0flvTEG8zLVkFZST"的

标签中。不管它，现将网页下载下来看看。

2.下载网页

先把网页下载下来，然后用BeautifulSoup提取评论内容即可。

import requests

def get_url(url):
    headers = {'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.163 Safari/535.1'}

    res = requests.get(url,headers = headers)

    return res

def main():
    url = input("请输入链接地址:")
    res = get_url(url)

    with open("res.txt","w",encoding = 'utf-8') as file:
        file.write(res.text)
        
if __name__ == "__main__":
    main()

输出的结果如下，需要自己输入相关歌曲的网页：

搜一下相关的评论，搜不到！说明评论不在这个文件中！那就说明，评论在别的文件中！

3.设置速度，找到目标文件

网速太快，刷一声，就加载了整个网页。

我们点开network，刷新一下，就可以发现很多源文件，它们就是组成整个网页的一部分：

我们要从这一堆文件里面找到藏有评论的文件；很显然，我们可以逐个文件翻查，但这方法有点麻烦。这里我们可以让浏览器慢点加载网页，当发现目标时，让时间停下来。

另外标签的顺序如下：

data = soup.select('#main > div > div.mtop.firstMod.clearfix > div.centerBox > ul.newsList > li > a')

翻车了，浏览器不可以！晚上回去更新下chrome!

评论是文档，我们可以直接查看XHR和DOC类型的文件。同时，下载目标文件时，我们会发现该文件时一个POST文件，记得我们前面说过POST文件需要什么吗？我们需要给服务器提交一些指定的数据，才能拿到我们想要的东西。这个我明天再更新出来！

猜你喜欢

转载自juejin.im/post/7026141408125796366

python网络爬虫-爬取云音乐评论（3）

python爬虫爬取网易云音乐的热门评论

python爬虫+词云图，爬取网易云音乐评论

【Python】爬虫-----爬取网易云音乐评论信息

Python爬虫实战 | 爬取网易云音乐评论

网易云音乐评论爬虫:爬取歌曲的全部评论

python爬取网易云音乐评论

python网络爬虫&&爬取网易云音乐

【爬虫Practice5】爬取网易云音乐评论

爬取网易云音乐评论！python 爬虫入门实战（六）selenium 入门！

python selenium 爬取网易云音乐歌曲评论

python爬取网易云音乐歌曲评论信息

python+selenium 爬取网易云音乐评论

python爬取网易云音乐歌曲评论

网易云音乐评论爬虫（三）:爬取歌曲的全部评论

爬取网易云音乐评论

爬取网易云音乐精彩评论

网易云音乐评论爬取

如何用Python网络爬虫爬取网易云音乐歌曲

利用Python网络爬虫实现对网易云音乐歌词爬取

Scrapy爬取网易云音乐和评论（五、评论）

[爬虫]Python爬取网易云音乐搜索并下载歌曲!

Python爬取网易云音乐热歌榜（爬虫）

爬虫练习：爬取网易云音乐热歌榜全部歌曲的热门评论

【2019.05】python 爬取网易云音乐评论（热门评论和全部评论）绘制词云图【大碗宽面】

爬取网易云音乐评论并使用词云展示

Python 网易云音乐评论爬虫

Python爬虫-爬取京东评论信息

利用Python爬取基于AES对称加密算法的网易云音乐用户评论数据

Python爬取网易云音乐榜单歌曲高赞评论

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)