利用Python爬取B站千万级数据，并对其进行简单的分析 - 代码天地

利用Python爬取B站千万级数据，并对其进行简单的分析

其他 2019-01-27 01:23:51 阅读次数: 0

前言

说起热门的B站相信很多喜欢玩动漫的，看最有创意的Up主的同学一定非常熟悉。B站上面除了动漫之外也有很多有趣的视频，也有很多教学视频，是非常不错的一个网站。

本篇文章要点

爬取10万用户数据

数据存储

数据词云分析

基本环境配置

版本：Python3

系统：Windows

相关模块：requests

想要学习Python？Python学习交流群：452739833，资料都已经上传群文件流，可以自行下载！

Python爬虫的基本思路

实现步骤

爬取用户数据

存入数据库

词云分析

词云效果图

代码的思路

需要找到B站用户的关注列表的json接口，因为B站的隐私设置，一个人只能爬取其他人的前5页关注，共100人。

从数据库中获取用户的名字，重复的次数越多说明越多的用户关注，然后我使用fate的一张图片作为词云的mask图片，最后生成词云图片。

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对小编的支持。

猜你喜欢

转载自blog.csdn.net/qq_40925239/article/details/86645456

利用Python爬取B站千万级数据，并对其进行简单的分析

python爬取B站千万级数据，发现了这些热门UP主的秘密！

python爬取拉勾职位数据并对其进行分析

利用python对b站某GPT-4解说视频的近万条弹幕进行爬取、数据挖掘、数据分析、弹幕数量预测及情绪分类

利用Python爬取B站摄影栏目的图片

如果利用Python爬取B站上千万数据？B站直播都是大屌萌妹吗？

Python 爬取猫眼电影《无名之辈》并对其进行数据分析

分析Ajax爬取B站python视频

Python 爬取 B 站 5000 条视频，揭秘为何千万人为它流泪！

爬取B站全站日榜前20数据进行数据分析与可视化

Python爬虫----爬取b站每日排行数据

简单的爬取B站视频评论

python爬取B站视频

将白嫖进行到底？简单爬虫爬取B站视频

爬取b站热门视频的弹幕，并进行弹幕分析

Python爬虫实现百度贴吧文本爬取【每天近千万级数据量】

如何利用Python快速爬取B站全站视频信息

利用python爬取b站弹幕和统计(附保存)

python爬取中国天气网站数据并对其进行数据可视化

python爬取B站视频弹幕分析并制作词云

Python爬取APP数据，进行APP逆向分析！

卧槽！原来爬取B站弹幕这么简单

作为一名爬虫人如何实现千万级数据爬取？

爬取b站弹幕

爬取B站视频

用xpath、bs4、re爬取B站python数据

如何去使用Python爬虫来爬取B站的弹幕数据？

Python 爬取热词并进行分类数据分析-[简单准备] （2020年寒假小目标05）

Python爬取全国最新房价信息保存为CSV文件,进行简单的数据分析

python爬取B站画友图片

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)