爬取学校官网新闻-生成词云 - 代码天地

爬取学校官网新闻-生成词云

其他 2019-03-10 18:51:21 阅读次数: 0

学习了一篇别人的文章之后，知道了怎么生成词云，于是在原来代码的基础上添加了生成词云的程序

import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt

#读取文件
file=open('fosu.csv',encoding='utf-8').read()
#结巴分词
wordlist=jieba.cut(file,cut_all=True)
# print(wordlist)
#去掉空格
# w1=' '.join(wordlist)
# print(w1)
ls=[]
count={}
for w in wordlist:
    ls.append(w)
    if len(w)<=1:
        continue
    else:
        #字典的get方法，如果有这个w，那么就返回字典中w的值，否则返回0，最终都+1
        count[w]=count.get(w,0)+1
# print(count)
#打印排序后的列表
items=list(count.items())
items.sort(key=lambda x:x[1],reverse=True)
print(items)
#设置背景，大小
wordcloud=WordCloud(
    background_color='white',
    #最多显示100个词语
    max_words=300,
    #设置有多少种配色方案
    max_font_size=100,
    height=1000,
    width=1000,
    #设置字体路径
    font_path='C:\Windows\Fonts\simfang.ttf',
    relative_scaling=0.9
)
#生成词云
# myword=wordcloud.generate(count)
#根据词频生成词云
myword=wordcloud.generate_from_frequencies(count)
#展示词云图
plt.imshow(myword)#默认配置
#axis是用来设置具体某一个坐标轴的属性的,修改xy轴的限制，进行等额递增
plt.axis('off')
plt.show() #显示图像
#保存词云图
wordcloud.to_file('cloud.jpg')

　　

猜你喜欢

转载自www.cnblogs.com/fodalaoyao/p/10506312.html

爬取学校官网新闻-生成词云

学校官网数据的爬取

爬取学校官网信息公告并存入数据库

python-xpath爬取mooc网并生成词云

制作学校官网

改版学校官网

学校官网的制作

python爬虫爬学校官网（悄咪咪）并分析

Python爬取新闻信息，分词统计并画词云

学校官网的展示设计

学校官网设计总结

爬取学校新闻网站信息

爬虫——爬取人民网数据生成词云图

学校官网与食品官网的区别

食品官网与学校官网的区别

爬虫大作业——爬取网站数据生成词云

nodejs 爬取前端面经并生成词云

爬取寻梦环游记的评论生成词云

批量爬取豆瓣短评并批量生成词云

爬取拉钩岗位信息生成图表和词云

爬取Bilibili视频评论，并生成云词图

Python网络爬虫（一）爬取、存储、生成词云

爬取唐诗宋词生成词云

简单爬取《小丑》电影豆瓣短评生成词云

java爬取商品评论，分词生成词云

爬取京东商品评价并生成词云

Python爬虫示例爬取豆瓣影评生成词云

简单用python的爬取文章生成词云

爬取某东娃娃评价，生成词云

【转】nodejs 爬取前端面经并生成词云

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)