问题:我们在爬取文本文字,如:爬取弹幕展示,需要展示在一张图片上时,可以运用词云模块来实现
from wordcloud import WordCloud
from scipy.misc import imread
# 初始化词云
color_mask = imread("backgroun.jpg") # 读取背景图片
cloud = WordCloud(
# 设置字体,不指定就会出现乱码,这个文件是字体文件,可以去网上下载一个,然后写上路径
font_path="D:\\SourceHanSerif-Heavy.ttc",
# 设置背景色
background_color='white',
# 词云形状,就是刚才读取的背景图片
mask=color_mask,
# 允许最大词汇,出os报错的时候可能就是这个设置过大了
max_words=100,
# 最大号字体,出os报错的时候可能就是这个设置过大了
# max_font_size=40
)
word_cloud = cloud.generate_from_text(get_str_content) # 产生词云 get_str_content为str类型,为输入的内容
word_cloud.to_file("3.png") # 保存图片
# 显示词云图片
plt.imshow(word_cloud)
plt.axis('off')
plt.show()