使用shell实现简单的词频统计

其他 2018-05-02 14:54:43 阅读次数: 2

需求：

统计如下中第二列单词出现的次数：

1,huabingood,100
2,haha,200
3,huabingood,300
4,haha,100
5,haha,200

具体代码：

cat a.txt | awk -F "," '{print $2}' | sort | uniq -c | sort -nrk 1

代码解释：

awk -F "," '{print $2}'    # 将数据按照逗号进行分割，并取出第二列的内容

sort　　# 将取出的内容进行排序。因为uniq统计时，如果重复的数据不连续，就会被认为时两个不同内容的行

uniq -c　　# 统计重复行出现的次数

sort -nrk 1　　# 按照第一列重复的次数，按照数字顺序进行降序排列

猜你喜欢

转载自www.cnblogs.com/yanghuabin/p/8980257.html

使用shell实现简单的词频统计

使用Spark实现词频统计

flink实现简单的词频统计实验

Shell统计词频

SHELL篇统计词频

LeeCode shell 统计词频

一行shell实现统计单词词频

shell(一)统计词频 LeetCode

shell 统计单词频率

python实现词频统计

词频统计（Java实现）

Java实现词频统计

Elasticsearch词频统计实现

利用python实现简单词频统计、构建词云

Python实现简单中文词频统计示例

IDEA增加Spark依赖关系及其简单使用-词频统计

简单的结巴分词与词频统计

使用Hadoop自带的例子wordcount实现词频统计

使用Scala程序实现WordCount--词频统计（代码）

说说如何使用 IKAnalyzer 实现词频统计并排序

flink 本地环境使用scala实现词频统计

用unorderedmap实现词频统计

MapReduce实现WordCount词频统计

python实现词频统计并展示

用Spark实现的词频统计

使用Storm进行词频统计

【文本处理词频统计】python 实现词频统计

Hive简单编程实践-词频统计

Spark shell 词频统计和统计PV心得

python实现中文分词和词频统计

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)