面试题：使用shell统计一个文件里面单词的出现频率 - 代码天地

面试题：使用shell统计一个文件里面单词的出现频率

其他 2021-11-20 20:54:09 阅读次数: 0

现有文件words.txt内容如下：
Spark Hive Hdfs Spark
Hdfs Spark Hive Yarn
统计该文件每个单词出现的频率（按照词频降序输出）：
结果：
Spark 3
Hdfs 2
Hive 2
Yarn 1

答案：

cat words.txt | tr -s ' ' '\n' | uniq -c | sort -r | awk '{print $2" "$1}'

tr -s ' ' '\n'：使用'\n'替换' '
uniq -c：检查文件并删除文件中重复出现的行，并在行首显示该行重复出现的次数
sort -r：以相反的顺序来排序
awk '{print $2" "$1}'：awk是按照空格切开，后面为输出第二个参数在前，第一个参数在后，以空格隔开

猜你喜欢

转载自blog.csdn.net/s_13J43QKKKAA/article/details/121428897

面试题：使用shell统计一个文件里面单词的出现频率

转载：Linux命令经典面试题：统计文件中出现次数最多的前10个单词

shell, 文字游戏，在一个文本文件中查找出每个单词的使用频率并排序

统计单词出现频率

做一个词频统计程序，该程序具有以下功能基本要求：（1）可导入任意英文文本文件（2）统计该英文文件中单词数和各单词出现的频率（次数），并能将单词按字典顺序输出。（3）将单词及频率写入文件。

统计文件中单词出现频率最高的10个以及他们出现的次数

主题：Linux基本命令面试题：统计文件a.txt中“每个单词”的重复出现次数

shell 统计单词频率

面试题：将一行字符串中的所有单词出现的数量统计出来

阿里面试题：一个 String 字符串占多少内存？

判断一个数是否为2的N次方（阿里面试题）

任一个英文的纯文本文件，统计其中的单词出现的个数。

python小程序——统计文件中第一个单词出现的次数

统计一篇英文文章内每个单词出现频率，并返回出现频率最高的前10个单词及其出现次数

python面试题--统计文件中字母出现的次数

面试题 16.02. 单词频率

LeetCode 面试题 16.02. 单词频率

LeetCode面试题 16.02: 单词频率

【哈希-中等】面试题 16.02. 单词频率

[LeetCode]面试题 16.02. 单词频率

阿里面试题：请问Tomcat是一个Servlet容器吗？里面大有文章

面试题：统计用户输入的字符串中第一个只出现一次的字符(C语言)

go语言之map练习（二):编写一个程序wordfreq程序，统计输入文本中每个单词出现的频率（次数）

【面试题总结】1、统计字符串中某个单词出现的次数

一个面试题

迅雷的一个面试题

一个Promise面试题 

一个腾讯的面试题

一个经典面试题

遇到的一个面试题

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)