linux统计txt文件中单词出现次数并排序

其他 2018-12-25 02:36:35 阅读次数: 0

文件：a.txt

任务：统计该文件中每一个单词出现的次数，并按照出现频率从大到小排序

sed 's/ /\n/g' "a.txt" | sort | uniq -c | sort -nr

解析：

sed替换

sed 's/被替换的字符串/新字符串/[替换选项]' filename

替换选项g表示替换文本中所有出现被替换字符串之处

uniq统计次数

uniq -c表示打印每行在文本中重复出现的次数

sort排序

-n根据数字大小进行排序

-r将排序结果逆向显示

增强版：

sed -e 's/\?//g' -e 's/ /\n/g' "test.txt" | sort | uniq -c | sort -nr

test.txt文件为：hello mylove i love you how about you do you love me?

当sed包含多个命令时，需要用-e分隔开来，第一个表示过滤掉文件中的"?"再进行计算。

输出结果为：

      3 you
      2 love
      1 mylove
      1 me
      1 i
      1 how
      1 hello
      1 do
      1 about

猜你喜欢

转载自blog.csdn.net/qq_37684824/article/details/83819746

linux统计txt文件中单词出现次数并排序

Linux统计文件中单词出现的次数

统计英文文档中每个单词出现的次数并排序

主题：Linux基本命令面试题：统计文件a.txt中“每个单词”的重复出现次数

Hadoop 统计文件中单词出现的次数

linux统计文档中字符串出现次数并排序（grep_sort_uniq）

sed详解:用一条Linux命令统计这个文件中某个单词出现的次数

Hadoop 统计文件中某个单词出现的次数

shell基础---awk+uniq+sort 统计文件中某字符串出现次数并排序

java统计文章中单词出现的次数

【Python】统计文本中单词的出现次数

linux查找某个文件中单词出现的次数

课堂作业：读取某路径下的txt文件中的单词出现次数

Linux统计单词次数并按次数排序

统计文件中单词出现频率最高的10个以及他们出现的次数

Linux统计日志文件中某一url出现的次数

linux统计文件中字符串出现次数

【BigData】Java基础_读取文件并统计文件中每个单词出现的次数

查询文件中单词出现的次数

3. Linux下实现统计文件单词个数和出现次数

python小程序——统计文件中第一个单词出现的次数

统计单词出现次数的mapreduce

统计文件中出现次数最多的前10的单词

统计文件里出现次数前10的单词

使用mapreduce统计文件中所有单词出现的次数

hadoop案例一（统计文本中单词出现的次数）

统计文本中英文字母及英文单词的次数并排序

统计文件中字符出现的次数

统计文件中某个词出现的次数

kotlin统计文件中字符出现的次数

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)