python爬虫,Scrapy爬取豆瓣电影《芳华》电影短评,分词生成词云图。

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ygc123189/article/details/79164607

项目github地址:https://github.com/kocor01/scrapy_cloud

Python版本为3.6


自己写的简单架构python爬虫,爬取豆瓣电影《芳华》电影短评,分词生成词云图。

这个是用Scrapy框架重新实现的


爬虫爬取最近比较火的电影《芳华》分词后生成词云图

使用了 jieba分词,云图用wordcloud生成

用了朋友的2B姿势的自拍照片简单的P了下(为了不暴露,P成全黑的),作为生成词云图的底图模板


在生成词云图的过程中,发现一个问题,词云图底图模板有PNG格式的图片生成出来的效果很差,例如用下图PNG格式去生成,生成出来的词语图根本不成人形。本例是用JPG格式的图片去生成,生成出来的效果还是相当不错的。建议底图用JPG去生成。其他格式的图片没试验,不知生成的效果如何。



词云图底图模板:



生成词云图效果:




猜你喜欢

转载自blog.csdn.net/ygc123189/article/details/79164607