LeetCode(Shell):193, 195, 192, 194

2019.11.26 LeetCode 从零单刷个人笔记整理(持续更新)

github:https://github.com/ChopinXBP/LeetCode-Babel


传送门:193 有效电话号码

给定一个包含电话号码列表(一行一个电话号码)的文本文件 file.txt,写一个 bash 脚本输出所有有效的电话号码。

你可以假设一个有效的电话号码必须满足以下两种格式: (xxx) xxx-xxxx 或 xxx-xxx-xxxx。(x 表示一个数字)

你也可以假设每行前后没有多余的空格字符。

示例:
假设 file.txt 内容如下:
987-123-4567
123 456 7890
(123) 456-7890

你的脚本应当输出下列有效的电话号码:
987-123-4567
(123) 456-7890

#!/bin/bash
#数据形式
#0(001) 345-0000
#(001) 345-0000
#123-456-789

#正则相关
# grep -E 使用正则表达式
# ^ 开头
# & 结尾
# [0-9]{3} 连续3位数字
# () 需要转义
# - 不需要转义
# | 连接两个模板


#grep+正则表达式
grep -E "^\([0-9]{3}\) [0-9]{3}-[0-9]{4}$|^[0-9]{3}-[0-9]{3}-[0-9]{4}$" file.txt

#awk+正则表达式
awk "/^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$/" file.txt

传送门:195 第十行

给定一个文本文件 file.txt,请只打印这个文件中的第十行。

示例:
假设 file.txt 有如下内容:
Line 1
Line 2
Line 3
Line 4
Line 5
Line 6
Line 7
Line 8
Line 9
Line 10

你的脚本应当显示第十行:
Line 10

#!/bin/bash
awk 'NR == 10' file.txt
sed -n 10p file.txt
tail -n+10 file.txt|head -1

传送门:192 统计词频

写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。

为了简单起见,你可以假设:

扫描二维码关注公众号,回复: 8567406 查看本文章

words.txt只包括小写字母和 ’ ’ 。

每个单词只由小写字母组成。

单词间由一个或多个空格字符分隔。

示例:
假设 words.txt 内容如下:
the day is sunny the the
the sunny is is

你的脚本应当输出(以词频降序排列):
the 4
is 3
sunny 2
day 1

说明:
不要担心词频相同的单词的排序问题,每个单词出现的频率都是唯一的。
你可以使用一行 Unix pipes 实现吗?

#!/bin/bash
# xargs 分割字符串 -n 1表示每行输出一个 可以加-d指定分割符
# 要使用uniq统计词频需要被统计文本相同字符前后在一起,所以先排序 uniq -c 表示同时输出出现次数
# sort -nr 其中-n表示把数字当做真正的数字处理(当数字被当做字符串处理,会出现11比2小的情况)
cat words.txt | xargs -n 1 | sort | uniq -c | sort -nr | awk '{print $2" "$1}'

# 在awk中我们用一个字典count储存每个单词的词频,先遍历每一行(awk自身机制)的每一个字段(i<=NF,NF代表列数),
# 然后用该字段本身作为key,将其value++;最后用一个for循环输出count数组中的每个元素的key(词)及其value(词频)。
# 关于sort命令:-r是倒序排序,-n是将字符串当作numeric数值排序,-k则指定用于排序的字段位置,后跟2指将第二位的count[k](词频)作为排序的key
cat words.txt |
awk '{
    for(i=1;i<=NF;i++){
        count[$i]++
    }
} END {
    for(k in count){
        print k" "count[k]
    }
}' |
sort -rnk 2

传送门:194 转置文件

给定一个文件 file.txt,转置它的内容。

你可以假设每行列数相同,并且每个字段由 ’ ’ 分隔.

示例:
假设 file.txt 文件内容如下:
name age
alice 21
ryan 30

应当输出:
name alice ryan
age 21 30

#!/bin/bash
#NF表示列数,NR代表当前行
awk '{
    for(i=1;i<=NF;i++){
        if(NR==1){
                lines[i]=$i
        }else{
                lines[i]=lines[i] " " $i
        }
    }
} END {
    for(i=1; i<=NF; i++){
        print lines[i]
    }
}' file.txt

#Coding一小时,Copying一秒钟。留个言点个赞呗,谢谢你#

发布了246 篇原创文章 · 获赞 316 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/qq_20304723/article/details/103258206