Python worldcloud 初识

在我们写代码的时经常需要用的一些不是很熟悉的工具,但又需要快速上手,最直接的方法就是看官方文档,不过,很多文档都是英文的(暴击),此博客就是帮助萌新快速上手的,不会牵涉很复杂的理论,老司机请自动略过(当然欢迎指正)

worldcloud的作用

基于 Python 的词云生成库,可以实现词频可视化,根据你给出字符串,对词频进行统计,以不同的大小显示出来

用法

  • 安装
pip install matplotlib  #python 的画图的包,类似于 MATLAB 中的 plot
pip install wordcloud
  • 输入
    worldcloud 的输入格式是,以空格为分隔符的字符串

  • 输出
    worldcloud 的输出是你指定的图片,在图片中可视化的将你输入的字符显示出来

Example

from matplotlib.image import imread
from wordcloud import WordCloud
font = '你自己电脑中安装的字体的路径'
kw_str = '今天 的 天气 真不错 啊,我们 一起 去 吃饭吧!' #你需要进行可视化的字符串
color_mask = imread(os.getcwd()+"/python.jpg")  # 读取背景图片
cloud = WordCloud(
 # 设置字体,不指定就会出现乱码
 font_path=font, #这个路径是pc中的字体路径
 # 设置背景色
 background_color='white',
 # 词云形状
 mask=color_mask,
 # 允许最大词汇
 max_words=2000,
 # 最大号字体
 max_font_size=40
)
word_cloud = cloud.generate(kw_str)  # 产生词云,输入的格式是以空格分隔的词语组成的字符串
word_cloud.to_file("pjl_cloud4.jpg")  # 保存图片
#  显示词云图片
plt.imshow(word_cloud)
plt.axis('off')
plt.show()

值得注意的是,如果你的字符串是英文的话,不指定字体也行,但如果要显示中文的话,就需要有事先安装的字体(一般电脑上都预装了很多字体的,挑一个兼容中文的就行`)类似于这种:NotoSansCJK-Regular.ttc

成果展示

给大家上一张成品,是不是挺有意思的,赶紧试试吧
这里写图片描述

猜你喜欢

转载自blog.csdn.net/slwhy/article/details/80229749