LeetCode192——统计词频

版权声明:我的GitHub:https://github.com/617076674。真诚求星! https://blog.csdn.net/qq_41231926/article/details/86620386

我的LeetCode代码仓:https://github.com/617076674/LeetCode

原题链接:https://leetcode-cn.com/problems/word-frequency/description/

题目描述:

知识点:Linux常用指令

思路一:cat+tr+sort+uniq+sort+awk

cat命令:用于连接文件并打印到标准输出设备上。

tr命令:用于转换或删除文件中的字符,其中的-s选项表示--squeeze-repeats,即缩减连续重复的字符成指定的单个字符。

sort命令:用于将文本文件内容加以排序,其中-r参数表示以相反的顺序来排序,本题中即降序。

uniq命令:用于删除文件中的重复行,其中-c选项表示在输出行前面加上每行在输入文件中出现的次数。

awk命令:AWK是一种处理文本文件的语言,是一个强大的文本分析工具。下述脚本中awk命令的用法表示每行按空格或TAB分割,输出文本中的第2、1项。

Bash脚本:

cat words.txt | tr -s ' ' '\n' | sort | uniq -c | sort -r | awk '{ print $2, $1 }'

LeetCode解题报告:

思路二:awk+sort

NF:是awk命令的内建变量,代表一条记录的字段的数目。

END:是awk命令的关键字,END{这里面放的是处理完所有的行后要执行的语句}。awk命令还有一个关键字BEGIN,BEGIN{这里面放的是执行前的语句}。而没有关键字时,{这里面放的是处理每一行时要执行的语句}。

sort命令的-n参数表示依照数值的大小排序,-r参数表示以相反的顺序来排序,-k参数选择以哪个区间来进行排序。

Bash脚本:

awk '{ for (i = 1; i <= NF; i++) { D[$i]++; } } END { for (i in D) { print i, D[i] } }' words.txt | sort -nr -k 2

LeetCode解题报告:

猜你喜欢

转载自blog.csdn.net/qq_41231926/article/details/86620386