【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论 - 代码天地

【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论

企业开发 2024-01-09 04:12:56 阅读次数: 0

一、目标整理

今天的目标是爬取小红书上指定笔记下的所有评论数据。

以某篇举例，有2千多条评论。
以下代码，截止2023-12-01 有效。

穿上了最漂亮的衣服向杀害孩子的凶手投石头

效果如下：

其他页

每条评论获取多个字段，

笔记链接
页码
评论者昵称
评论者ID
评论者主页链接
评论时间
评论IP属地
评论点赞数
评论级别
评论内容

而评论包含根级评论、二级评论和二级展开评论（评论回复）。

二、逻辑分析

接口分析

抓取目标

可以看到从这个接口中获取了我们想要的数据，左边是内容展示，右边是接口返回的相关字段。

请求头

请求头

# 请求头
headers = {
   
    
    
	'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36',
	# cookie需定期更换
	'Cookie': 'xxxxxx',
}

请求头这部分主要的就是UA和Cookie，其中Cookie需要定期更换，否则会出现响应数据为空的情况。

请求参数

简单说明一下这几个参数：

note_id 这个是笔记的ID，为固定值
cusor，获取第一页的时候可以为空，获取后面评论的时候需要使用，稍后再讲
top_comment_id ，同样首次请求可以为空，之后才需要。
image_scenes 固定值</

猜你喜欢

转载自blog.csdn.net/u013046615/article/details/134375458

【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论

使用Python获取小红书笔记与评论（仅供学习交流）

小红书笔记视频评论

用Python采集了几千条相亲文案，终于发现了告别单身的秘密

爬取冰冰B站千条评论，看看大家说了什么！

Python爬虫入门实战4：获取CSDN博文评论及添加新评论

90后的结婚率不到10%？用Python采集了几千条相亲文案。让你告别单身。

用Python采集了几千条相亲文案，我终于发现了告别单身的秘密

小红书差评笔记下沉 | 如何让小红书笔记下沉

scrapy 爬取腾讯招聘几千条数据

Pythont通过request以及BeautifulSoup爬取几千条情话

MyBatis批量插入几千条数据导致idea卡死，cpu飙升，

MyBatis批量插入几千条数据，请慎用foreach

小红书点赞不显示怎么回事?小红书笔记评论被吞怎么办

【你评论，我送书】Python的爬虫基础知识

Python爬虫爬取豆瓣电影评论内容，评论时间和评论人

python爬虫 - 京东评论

实战 Python 网络爬虫：美团美食商家信息和用户评论

Python 网络爬虫实战：爬取 B站《全职高手》20万条评论数据

python爬虫实战---网易云音乐评论抓取

Python实操评论列表爬虫实战

Python爬虫实战 | 爬取网易云音乐评论

爬虫实战2-某博评论和回复

使用Python+BI爬取数千条车厘子相关数据，最终发现了这些秘密

多级评论的实现

Django中的多级评论

Python 抖音视频和评论爬虫

python爬虫新浪微博评论、评论人信息

【网络爬虫实战】抓取腾讯视频评论

爬虫实战系列(六)：网易云音乐评论还可以这样获取

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)