用Python分析B站视频弹幕 - 代码天地

用Python分析B站视频弹幕

其他 2020-01-12 11:45:43 阅读次数: 0

文章目录

采集弹幕数据
导入数据并进行处理
jieba分词
设置词云参数
生成词云并保存到本地
最终效果
完整代码

采集弹幕数据

用Python爬取B站视频弹幕

导入数据并进行处理

在这里插入图片描述

jieba分词

在这里插入图片描述

设置词云参数

在这里插入图片描述

生成词云并保存到本地

在这里插入图片描述

最终效果

背景图片

完整代码

# ！/usr/bin/env python
# —*— coding: utf-8 —*—
# @Time:    2020/1/1 15:53
# @Author:  Martin
# @File:    Barrage_Analysis.py
# @Software:PyCharm

import pandas as pd
import jieba
import matplotlib.pyplot as plt
from random import randint
from wordcloud import WordCloud
# 弹幕数据读入
csv_data = pd.read_csv('./result/Barrage.csv')
# 数据处理
barrage_str = ""
for row in csv_data.itertuples():
    barrage_str += getattr(row, '弹幕内容')
# jieba分词
words_list = jieba.lcut(barrage_str)
words_str = "".join(words_list)


# 设置词云参数
def random_color_func(word=None, font_size=None, position=None, orientation=None, font_path=None, random_state=None):
    h = randint(120, 250)
    s = int(100.0 * 255.0 / 255.0)
    l = int(100.0 * float(randint(60, 120)) / 255.0)
    return "hsl({}, {}%, {}%)".format(h, s, l)


background_Image = plt.imread('./res/xin.jpg')
wc = WordCloud(
    background_color='white',
    mask=background_Image,
    font_path='./res/黑体.ttf',
    max_words=2000,
    max_font_size=100,
    min_font_size=5,
    color_func=random_color_func,
    random_state=50
)
# 产生词云
word_cloud = wc.generate(words_str)
# 保存到本地
word_cloud.to_file('./result/barrage.jpg')

虐猫人薛定谔i

发布了102 篇原创文章 · 获赞 93 · 访问量 9658

私信关注

猜你喜欢

转载自blog.csdn.net/Deep___Learning/article/details/103794274

用Python分析B站视频弹幕

用Python爬取B站视频弹幕

Python爬虫b站视频弹幕并生成词云图分析

python爬取B站视频弹幕分析并制作词云

“垃圾分类”大家怎么说？用Python来分析b站弹幕

Python获取B站视频弹幕简单处理

用python爬取B站弹幕并绘制词云

分析了b站敬汉卿的所有视频的弹幕,最多的弹幕居然是

爬取b站热门视频的弹幕，并进行弹幕分析

Python利用GUI界面制作B站弹幕分析工具

关于《后浪》的B站弹幕分析总结（一）——爬取B站视频的上万条弹幕的方法

利用python对b站某GPT-4解说视频的近万条弹幕进行爬取、数据挖掘、数据分析、弹幕数量预测及情绪分类

python爬虫----b站的弹幕获取

使用Python获取B站弹幕

Python解密b站protobuf弹幕

python爬虫之-获取b站搜索页面所有视频弹幕

Python爬虫爬取B站视频弹幕 + 绘制词云

Python3，多线程爬完B站UP主的视频弹幕及评论，我飘了~ ~ ~

Python爬取B站不讲武德、耗子尾汁出处的视频弹幕

Python爬取B站耗子尾汁、不讲武德出处的视频弹幕

Python爬虫新手入门教学（五）：爬取B站视频弹幕

抗击肺炎，我们能做到的，就是别让爱隔离——python分析B站三个视频弹幕内容，云图数据。

为了自动采集B站弹幕，我用Python开发了一个下载器

[源码和文档分享]基于python的B站弹幕数据分析（爬虫+可视化）

b站弹幕

B站弹幕爬虫

B站刷弹幕

爬虫实战---爬取B站视频弹幕（春物）

宝藏B站UP主，视频弹幕尽收囊中！

冰冰B站视频弹幕爬取原理解析

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)