《我不是药神》评论词云分析 - 代码天地

《我不是药神》评论词云分析

其他 2018-09-04 14:21:28 阅读次数: 0

版权声明： https://blog.csdn.net/qq_34246164/article/details/81985653

继上一篇爬取《我不是药神》的评论后，现在开始使用jieba分词和词云来分析评论。

下面是代码：

import matplotlib.pyplot as plt
from wordcloud import WordCloud
from scipy.misc import imread
import jieba

text = open(r"yaoshen.txt","rb").read()
wordlist = jieba.cut(text)
wl = ' '.join(wordlist)      #将分词后的文本存入到一个列表中

#设置停用词
stopwords_list = []
with open('stopwords.txt', 'r') as f:
    for line in f.readlines():
        stopwords_list.append(line.strip()
            )                                             #停用词设置
wc = WordCloud(background_color = "white", #设置背景颜色
               mask = imread('shen.png'),  #设置背景图片
               max_words = 2000, #设置最大显示的字数
               stopwords = stopwords_list,    #["的", "这种", "这样", "还是", "就是", "这个", "没有","但是", "可以","真的","我们","导演", "看到","一个",'可能','一部'], #设置停用词
               font_path = r"C:\Windows\Fonts\simkai.ttf",  # 设置为楷体 常规
               #设置中文字体，使得词云可以显示（词云默认字体是“DroidSansMono.ttf字体库”，不支持中文）
               max_font_size = 60,  #设置字体最大值
               random_state = 30, #设置有多少种随机生成状态，即有多少种配色方案
               )

myword = wc.generate(wl)#生成词云
wc.to_file('result.jpg')

#展示词云图
plt.imshow(myword)
plt.axis("off")
plt.show()

运行后可以得到的词云：

我不是药神评论词云

猜你喜欢

转载自blog.csdn.net/qq_34246164/article/details/81985653

《我不是药神》评论词云分析

《我不是药神》影评，逐页评论自动生成词云

Python分析《我不是药神》豆瓣评论

使用Python分析《我不是药神》电影豆瓣评论

python3.6爬取豆瓣电影《我不是药神》的短评、去停用词、词云分析处理

我不是药神

《我不是药神》

从《我不是药神》说起

【电影】我不是药神

我不是药神百度云网盘

《我不是药神》电影百度云资源

观《我不是药神》后感

《我不是药神》观影感

对《我不是神药》的点点看法

《我不是药神》观后感

我不是药神观后感

《我不是药神》——生如夏花

我不是药神观影体验

我不是药神观影感

我不是药神，但我有“神”器

我不是药神电影百度云盘分享下载

爬虫综合大作业---分析《我不是药神》豆瓣电影短评

观《我不是药神》有感

用 Python 带你看《我不是药神》

在《我不是药神》中看区块链发展的必要！

《我不是药神》明星见面会

我不是药神，救不了你的穷根

【Python3爬虫】豆瓣《我不是药神》短评

我不是药神--格列卫诞生记

python 《我不是药神》豆瓣影评爬取

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)