统计文本中特定词汇的出现频率 - 代码天地

统计文本中特定词汇的出现频率

其他 2019-09-09 00:01:15 阅读次数: 0

import jieba
txt=open('threekingdoms.txt','r',encoding='gb18030').read()
excludes={'将军','却说','荆州','二人','不可','不能','如此'}
words=jieba.lcut(txt)
counts={}
for word in words:
    if len(word)==1:
        continue
    elif word=='诸葛亮' or word=='孔明曰':
        rword='孔明'
    elif word=='关公' or word=='云长':
        rword='关羽'
    elif word=='玄德' or word=='玄德曰':
        rword='刘备'
    elif word=='孟德' or word=='丞相':
        rword='曹操'
    else:
        rword=word
    counts[rword]=counts.get(rword,0)+1
for word in excludes:
    del counts[word]
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(10):
    word,count=items[i]
    print('{0:<10}{1:>5}'.format(word,count))

猜你喜欢

转载自www.cnblogs.com/Aluosen/p/11489228.html

统计文本中特定词汇的出现频率

文本词汇频率统计

Python中如何统计文本词汇出现的次数?

python 统计哈姆雷特词汇频率

如何使用linux命令统计文本中某个单词的出现频率

统计文档中单词出现频率

如何统计英文文本中词汇的出现次数

统计单词出现频率

统计英文名著中单词出现频率

输出哈利波特英文文本中字母出现的频率

统计字符出现频率（java）

reduce统计字符出现频率

【Python】统计文本中单词的出现次数

go语言之map练习（二):编写一个程序wordfreq程序，统计输入文本中每个单词出现的频率（次数）

【大数据基础】统计某目录下的所有文本文件的单词出现频率

链表实例：对英语文本文件单词字符出现频率统计

统计文件中单词出现频率最高的10个以及他们出现的次数

统计英文文章单词出现的频率

查找文本中出现频率最高的单词

统计字符串中各英文字母出现的频率并按频度排序

前端考题2：统计字符串中每个字符的出现频率

C语言—统计一串字符中各个字符的出现频率

《Java》Java实现一个“计算文本中某个词出现频率”的应用程序

shell如何统计文本中每种字符的出现次数

hadoop案例一（统计文本中单词出现的次数）

做一个词频统计程序，该程序具有以下功能基本要求：（1）可导入任意英文文本文件（2）统计该英文文件中单词数和各单词出现的频率（次数），并能将单词按字典顺序输出。（3）将单词及频率写入文件。

sortrows函数应用：统计数组中各个数据出现的次数，并按出现的频率进行排序

(四)利用Hadoop MapReduce 实现文本单词频率统计

bash实现统计文本词频率并排序

读入一个字符串，统计字符串中不同字符的出现频率。

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)