词云图是数据可视化的一种形式,其视觉冲击力比较强,迎合着现在快节奏的生活,让人一眼就看出这是主题,而不是像以前一样要看密密麻麻的文字报告。
首先安装jieba和wordcloud库
pip install jieba wordcloud
出现以上截图就是安装成功了。
然后将所需要的读取的词语存入TXT文件中
生成词云图的代码
import jieba
from wordcloud import WordCloud
import numpy as np
from PIL import Image
from matplotlib import colors
import collections
def chinese_jieba():
# 读取目标文本
with open(r'稻香.txt', encoding='utf-8') as fp:
txt = fp.read()
fp.close()
wordlist_jieba = jieba.lcut(txt) # 将文本分割,返回列表
txt_jieba = " ".join(wordlist_jieba) # 将列表拼接为以空格为间断的字符串
return txt_jieba
def wordcloud_generate():
txt = chinese_jieba()#读取文本
colormaps = colors.ListedColormap(['#871A84', '#BC0F6A', '#BC0F60', '#CC5F6A', '#AC1F4A']) # 自定义字体色,该系列是蓝紫色
wordcloud = WordCloud(font_path='simhei.ttf', # 字体
prefer_horizontal=0.99,#大部分都是横向排放
background_color='white', # 背景色
max_words=100, # 显示单词数
max_font_size=400,
colormap=colormaps,#使用自定义颜色
collocations=False
).generate(txt)
image = wordcloud.to_image()
image.show() # 展示图片
wordcloud.to_file('词云图.jpg') # 保存图片
if __name__ == '__main__':
wordcloud_generate()
以上代码可直接使用,也可以根据自己的想法去编辑图片样式