LeetCode（Shell）：193, 195, 192, 194

2019.11.26 LeetCode 从零单刷个人笔记整理（持续更新）

github：https://github.com/ChopinXBP/LeetCode-Babel

给定一个包含电话号码列表（一行一个电话号码）的文本文件 file.txt，写一个 bash 脚本输出所有有效的电话号码。

你可以假设一个有效的电话号码必须满足以下两种格式： (xxx) xxx-xxxx 或 xxx-xxx-xxxx。（x 表示一个数字）

你也可以假设每行前后没有多余的空格字符。

示例:
假设 file.txt 内容如下：
987-123-4567
123 456 7890
(123) 456-7890

你的脚本应当输出下列有效的电话号码：
987-123-4567
(123) 456-7890

#!/bin/bash
#数据形式
#0(001) 345-0000
#(001) 345-0000
#123-456-789

#正则相关
# grep -E 使用正则表达式
# ^ 开头
# & 结尾
# [0-9]{3} 连续3位数字
# () 需要转义
# - 不需要转义
# | 连接两个模板


#grep+正则表达式
grep -E "^\([0-9]{3}\) [0-9]{3}-[0-9]{4}$|^[0-9]{3}-[0-9]{3}-[0-9]{4}$" file.txt

#awk+正则表达式
awk "/^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$/" file.txt

传送门：195 第十行

给定一个文本文件 file.txt，请只打印这个文件中的第十行。

示例:
假设 file.txt 有如下内容：
Line 1
Line 2
Line 3
Line 4
Line 5
Line 6
Line 7
Line 8
Line 9
Line 10

你的脚本应当显示第十行：
Line 10

#!/bin/bash
awk 'NR == 10' file.txt
sed -n 10p file.txt
tail -n+10 file.txt|head -1

传送门：192 统计词频

写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。

为了简单起见，你可以假设：

扫描二维码关注公众号，回复： 8567406 查看本文章

words.txt只包括小写字母和 ’ ’ 。

每个单词只由小写字母组成。

单词间由一个或多个空格字符分隔。

示例:
假设 words.txt 内容如下：
the day is sunny the the
the sunny is is

你的脚本应当输出（以词频降序排列）：
the 4
is 3
sunny 2
day 1

说明:
不要担心词频相同的单词的排序问题，每个单词出现的频率都是唯一的。
你可以使用一行 Unix pipes 实现吗？

#!/bin/bash
# xargs 分割字符串 -n 1表示每行输出一个 可以加-d指定分割符
# 要使用uniq统计词频需要被统计文本相同字符前后在一起，所以先排序 uniq -c 表示同时输出出现次数
# sort -nr 其中-n表示把数字当做真正的数字处理(当数字被当做字符串处理，会出现11比2小的情况)
cat words.txt | xargs -n 1 | sort | uniq -c | sort -nr | awk '{print $2" "$1}'

# 在awk中我们用一个字典count储存每个单词的词频，先遍历每一行(awk自身机制)的每一个字段(i<=NF，NF代表列数)，
# 然后用该字段本身作为key,将其value++；最后用一个for循环输出count数组中的每个元素的key(词)及其value(词频)。
# 关于sort命令：-r是倒序排序，-n是将字符串当作numeric数值排序，-k则指定用于排序的字段位置，后跟2指将第二位的count[k](词频)作为排序的key
cat words.txt |
awk '{
    for(i=1;i<=NF;i++){
        count[$i]++
    }
} END {
    for(k in count){
        print k" "count[k]
    }
}' |
sort -rnk 2

传送门：194 转置文件

给定一个文件 file.txt，转置它的内容。

你可以假设每行列数相同，并且每个字段由 ’ ’ 分隔.

示例:
假设 file.txt 文件内容如下：
name age
alice 21
ryan 30

应当输出：
name alice ryan
age 21 30

#!/bin/bash
#NF表示列数，NR代表当前行
awk '{
    for(i=1;i<=NF;i++){
        if(NR==1){
                lines[i]=$i
        }else{
                lines[i]=lines[i] " " $i
        }
    }
} END {
    for(i=1; i<=NF; i++){
        print lines[i]
    }
}' file.txt

#Coding一小时，Copying一秒钟。留个言点个赞呗，谢谢你#

NJU_ChopinXBP

发布了246 篇原创文章 · 获赞 316 · 访问量 3万+

私信关注

LeetCode（Shell）：193, 195, 192, 194

猜你喜欢