统计哈姆雷特文本中高频词的个数

其他 2018-11-12 05:10:52 阅读次数: 0

版权声明：本文为博主原创文章，但部分内容来源自互联网，大家可以随意转载，点赞或留言均可！ https://blog.csdn.net/csdn_kou/article/details/83962302

统计哈姆雷特文本中高频词的个数

三国演义人物出场统计

开源代码
 讲解视频

kou@ubuntu:~/python$ cat ClaHamlet.py 
#!/usr/bin/env python
# coding=utf-8

#e10.1CalHamlet.py
def getText():
    txt = open("hamlet.txt", "r").read()
    txt = txt.lower()
    for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':
        txt = txt.replace(ch, " ")   #将文本中特殊字符替换为空格
    return txt
hamletTxt = getText()
words  = hamletTxt.split()
counts = {}
for word in words:			
    counts[word] = counts.get(word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True) 
for i in range(10):
    word, count = items[i]
    print ("{0:<10}{1:>5}".format(word, count))

猜你喜欢

转载自blog.csdn.net/csdn_kou/article/details/83962302

统计哈姆雷特文本中高频词的个数

Python快速统计文件中高频词

统计高频词

Python高频词统计

统计文档中前5个高频词个数并输出

利用jieba实现分词、高频词统计、词性标注

统计托福高频词汇

819. Most Common Word 统计高频词（暂未被禁止）

seo与python大数据结合给文本分词并提取高频词

python 哈姆雷特字数统计词云

运用jieba库寻找高频词

面试者简历的分析（高频词）

（笔记）jieba提取高频词

1-20高频词

大数据高频词算法实战（一）

【NLP学习笔记】用jieba实现高频词提取

词法分析-利用Jieba实现高频词提取（Python）

jieba分词和高频词提取示例代码

如何从大量数据中找出高频词

如何从大量数据中找出高频词？

❤️Java面试高频词《多线程》（建议收藏）❤️

使用 AWK 统计文本中匹配关键词的个数

45个高频词的一词多义和固定搭配

【文本文件单词数统计】统计《哈姆雷特》作品文本文件中除一些冠词、代词、连接词之外出现最多的单词，打印数量最多的前十个单词

会计高频词汇

科技无障碍盛会举办，人工智能和创新成为高频词

大数据面试题——如何从大量数据中找出高频词

Python Counter most_common方法计算一本词典的高频词

夺命雷公狗—玩转SEO---45---浅入批量获得高频词

恋练有词考研英语高频词汇思维导图—Unit4

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)