词频统计及词云绘制 - 代码天地

词频统计及词云绘制

其他 2019-04-04 01:48:05 阅读次数: 0

首先，在电脑上安装jieba库，进入命令提示符，输入pip install jieba，接下来就等系统自动安装

然后再进入IDLE建立一个脚本，用open函数打开只读模式，用jieba.lcut函数剪下词组，对每一个剪下的词组进行统计，最后输出。

 1 import jieba
 2 txt = open(r"F:\清道夫.txt", "r", encoding='utf-8').read()
 3 words  = jieba.lcut(txt)
 4 counts = {}
 5 for word in words:
 6     if len(word) == 1:  #排除单个字符的分词结果
 7         continue
 8     else:
 9         counts[word] = counts.get(word,0) + 1
10 items = list(counts.items())
11 items.sort(key=lambda x:x[1], reverse=True) 
12 for i in range(10):
13     word, count = items[i]
14     print ("{0:<10}{1:>5}".format(word, count))

运行结果如下

然后来绘制词云，需要先安装wordcloud库，还是用上面的方法，pip install wordcloud,安装好之后，执行如下代码

from wordcloud import WordCloud
with open("F:\清道夫.txt",encoding="utf-8")as file:
    text=file.read()
    wordcloud=WordCloud(
        font_path="C:/Windows/Fonts/simfang.ttf",
        background_color="white",
        width=600,
        height=300,max_words=50).generate(text)
    image=wordcloud.to_image()
    image.show()

效果如下

猜你喜欢

转载自www.cnblogs.com/lzz807237221/p/10652584.html

词频统计及词云绘制

【文本挖掘】——词频统计、词云绘制与美化+[微微一笑很倾城]实战

中文词频统计与词云生成

python词频统计生成词云

利用python实现简单词频统计、构建词云

使用Python统计文件中词频，并且生成词云

作业：中文词频统计与词云生成

用jieba库统计文本词频及云词图的生成

文本分析4-词频统计与词云展示

使用python读取word统计词频并生成词云

jieba （中文词频统计）、collections （字频统计）、WordCloud （词云） py库： jieba （中文词频统计）、collections （字频统计）、WordCloud （词云）

python词云图词频统计

jieba库使用和好看的词云用jieba库统计文本词频及云词图的生成

如何用R包做词频统计图（词云）？

用Python实现一个词频统计(词云+图）

Python之酒店评论分词、词性标注、TF-IDF、词频统计、词云

初探nlp 词频统计，去停顿词

python 统计词频，过滤词频小于2的词

词云绘制wordcloud

WordCloud绘制词云

Python绘制词云

Python词云绘制

Python-继人物词频统计三国演义之后-三国词云（Wordcloud）

Python——对淘宝评论词频统计并生成词云图

4.2 词频统计提取关键词

词频统计简单 LeetCode748. 最短补全词

[Python与经管学术]关键词词频统计与输出

Jieba进行词频统计与关键词提取

excel 通过SUMIF关键词统计词频

词频统计

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)