版权声明:我的GitHub:https://github.com/617076674。真诚求星! https://blog.csdn.net/qq_41231926/article/details/86620386
我的LeetCode代码仓:https://github.com/617076674/LeetCode
原题链接:https://leetcode-cn.com/problems/word-frequency/description/
题目描述:
知识点:Linux常用指令
思路一:cat+tr+sort+uniq+sort+awk
cat命令:用于连接文件并打印到标准输出设备上。
tr命令:用于转换或删除文件中的字符,其中的-s选项表示--squeeze-repeats,即缩减连续重复的字符成指定的单个字符。
sort命令:用于将文本文件内容加以排序,其中-r参数表示以相反的顺序来排序,本题中即降序。
uniq命令:用于删除文件中的重复行,其中-c选项表示在输出行前面加上每行在输入文件中出现的次数。
awk命令:AWK是一种处理文本文件的语言,是一个强大的文本分析工具。下述脚本中awk命令的用法表示每行按空格或TAB分割,输出文本中的第2、1项。
Bash脚本:
cat words.txt | tr -s ' ' '\n' | sort | uniq -c | sort -r | awk '{ print $2, $1 }'
LeetCode解题报告:
思路二:awk+sort
NF:是awk命令的内建变量,代表一条记录的字段的数目。
END:是awk命令的关键字,END{这里面放的是处理完所有的行后要执行的语句}。awk命令还有一个关键字BEGIN,BEGIN{这里面放的是执行前的语句}。而没有关键字时,{这里面放的是处理每一行时要执行的语句}。
sort命令的-n参数表示依照数值的大小排序,-r参数表示以相反的顺序来排序,-k参数选择以哪个区间来进行排序。
Bash脚本:
awk '{ for (i = 1; i <= NF; i++) { D[$i]++; } } END { for (i in D) { print i, D[i] } }' words.txt | sort -nr -k 2
LeetCode解题报告: