Python3之wordcloud库使用

版权声明:大佬们转载时别忘了我哦!!! https://blog.csdn.net/sun9979/article/details/89043617

1、wordcloud库的基本介绍

  • wordcloud是优秀的词云展示第三方库
  • 词云以词语为基本单位,更加直观和艺术地展示文本

2、wordcloud库的安装

由于我的电脑直接输入 pip install wordcloud不行 ,所以换一个数据源
直接输入 pip install wordcloud -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

3、wordcloud库的使用

  • wordcloud库把词云当成一个WordCloud对象,wordcloud.WordCloud()代表一个文本对应的词云
  • 可以根据文本中词语出现的频率等参数绘制词云
  • 词云的绘制形状、尺寸和颜色都可以设定
    在这里插入图片描述
import wordcloud
c=wordcloud.WordCloud()		#配置对象参数
c.generate("wordcloud by python")	#加载词云文本
c.to_file("python.png")

完成的功能:

  • 分隔:以空格分隔单词
  • 统计:统计单词出现次数并过滤较短的
  • 字体:根据统计配置字号
  • 布局:颜色环境尺寸

配置对象参数:

width	#制定词云对象生成图片的宽度,默认400像素
>>> w=wordcloud.WordCloud(width=800)

height	#指定词云对象生成图片的高度,默认200像素
>>> w=wordcloud.WordCloud(height=400)

min_font_size	#指定词云中字体的最小字号,默认4>>> w=wordcloud.WordCloud(min_font_size=10)

max_font_size	#指定词云中字体的最大字号,根据高度自动调节
>>>w=wordcloud.WordCloud(max_font_size=20)

font_step	#指定词云中字体字号的步进间隔,默认为1
>>> w=wordcloud.WordCloud(font_step=2)

font_path	#指定字体文件的路径,默认None
>>> w=wordcloud.WordCloud(font_path="msyh.ttc")

max_words	#指定词云显示的最大单词数量,默认200
>>>w=wordcloud.WordCloud(max_words=20)

stop_words		#指定词云的排除词列表,即不显示的单词列表
>>> w=wordcloud.WordCloud(stop_words={"python"})

background_color	#指定词云图片的背景颜色,默认为黑色
>>> w=wordcloud.WordCloud(background_color="write")

mask	#指定词云形状,默认为长方形,需要引用imread()函数
>>>form scipy.misc import imread
>>>mk=imreak("python.png")
>>>w=wordcloud.WordCloud(mask=mk)
英文实例:
import wordcloud
txt="life is short,you need python"
w==wordcloud.WordCloud(\
		background_color="white")
w.generate(txt)
w.to_file("python.png")

中文实例:(中文需要jieba库先进行分词才行)
import wordcloud
import jieba
txt="程序设计语言是计算机能够理解的\
识别用户操作意图的一种交互体系,它按照\
特定规则组织计算机指令,是计算机能够自\
动进行各种运算处理"
w=wordcloud.WordCloud(width=1000,\
	font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("python.png")

猜你喜欢

转载自blog.csdn.net/sun9979/article/details/89043617