一、正则表达式特殊符号：

二、grep的用法

grep    [-A|B|a|c|i|n|v]    [--color=auto]    '搜索字串'    filename


-A ===> after缩写，后面接数字，除了列出该列外，还列出后续的n列
-B ===> before缩写，后面接数字，除了列出该列外，还列出前面的n列
-a ===> 将二进制binary文件以text文件的方式查找数据
-c ===> 记录找到字符串的次数
-i ===> 忽略大小写
-n ===> 输出行号
-v ===> 反向选择
--color-auto ===> 将找到的关键字用特殊颜色标注

1.普通用法

eg:

2.grep配合正则表达式用法

（1）将nginx文件中所有包含大写字符的行列出来，并标明行号

3.常见符号的用法

[] ===> 集合字符

- ===> 大小写字母和数字范围

^ ===> 指定字符出现在行首 | 取反
=======================================注释========================================

注意：这里的 ^ 可能代表行首也可能代表取反，[]代表集合符号

若为 ^[*] 则代表行首,即在括号 [] 之外代表行首。

若为 [^*] 则代表取反，即在括号 [] 之内代表取反。
==================================================================================

$ ===> 指定字符出现在行尾

. ===> 任意字符

* ===> 重复字符

=======================================注释========================================

注意：*?代表还有任意多个?字符的意思，即包含0个的可能，因此若至少要求含有两个a,则必须写成这样 : aaa*
===================================================================================

{} ===> 限定重复字符
=======================================注释========================================
?{x} 代表还有连续5个或5个以上?字符
?{x,y} 代表含有x到y个?字符
在shell里｛和｝是有特殊含义的，因此需要加转义字符 \ 
===================================================================================

（1）查找成绩单中是5的倍数的成绩

（2）将0-60的成绩输出（假设没有满分的）

（3）将成绩中不含3的成绩输出

（4）将mark文件中的空白行显示出来

grep -n '^$' mark.txt

注意 ^为行首 $为行尾，仅有行首和行尾的行即为空白行

（5）将profile文件除了注释行都显示出来

 grep '^[^#]' /etc/profile

注意：
第一个^是行首，第二个^是取反。
综合意思就是行首不是#的数据，即非注释数据

（6）查找含有 b..h 的行，.其中 . 代表任意字符,但是一个 . 仅占用一个字符）

（7）将成绩中含有1的成绩都输出来

（8）将mark文件中还有2-5个重复字符'5'的行输出来

grep '[^5]5\{2,5\}[^5]' mark.txt

注意：

最前和最后的[^5]代表要查找的含有2-5个'5'的字符串前后不再是'5'

三、sed用法

sed    [-nefr]    动作


-n ===> 安静模式，仅将经过sed特殊处理的那一行或者动作才列出来
-e ===> 直接在命令行进行sed的动作编辑
-f ===> 接文件，直接将sed的动作写在文件内
-r ===> sed的动作支持的是延伸型正则表达式（默认支持普通型正则表达式）
-i ===> 直接修改读取的文件内容，而不是由屏幕输出


动作：

[n1] | [n1,n2]function

a ===> 新增，后接的字符串会在当前行的下一行出现
c ===> 取代，后接的字符串会取代n1或n1-n2的内容
s ===> 取代，直接进行取代，通常搭配正则表达式
d ===> 删除
i ===> 插入，后接的字符串会在当前行的上一行出现
p ===> 打印输出,经常配合 -n

实战演练：

1.查看mark文件当前内容

2.在第10行后新增'lanyue'字符串并输出

3.删除第十一行的内容并输出

4.将mark第6行替换为666666输出，但是不改变源文件

5.将本机的IP地址输出（注意：这里是重点，代表着sed可以以行为单位进行处理）

（1）先来查看一下数据原始格式

（2）我们需要的仅仅是IP，所以首先要先将行过滤出来，然后再去头去尾

 ifconfig | grep 'broadcast' | sed 's/.*inet//g' | sed 's/netmask.*//g'


注意：
grep 'broadcast' 为过滤出包含IP地址的行来
sed 's/.*inet//g' 为去头
sed 's/netmask.*//g' 为去尾

四、扩展正则表达式

基础的正则表达式已经足够使用了，这里可以先稍作了解就行

五、awk

相比较于sed处理整行的用法，awk更倾向于处理某行字段。

awk    '条件类型1{动作1}    条件类型2｛动作2｝    ......    条件类型n{动作n}'    filename



注意：
awk会将一行的数据分成指定段，每段都是一个变量从$1开始到$n。整行数据的变量用$0表示

内置变量：

逻辑运算符：

注意：

所有的awk动作，即在｛｝里面内的动作，如果需要多条命令辅助时，可以通过 ; （封号）或者 Enter（回车）来隔开每个指令

实例：列出当前系统所有的账号名称，并且将UID和GID输出

 cat /etc/passwd | awk 'FS=":"{print $1 "\t" $3"\t" $4}'



注意：
passwd中，每个字段以:隔开，所以为了分出每个变量需要使用FS=":"条件表达式

IT-蓝月

发布了304 篇原创文章 · 获赞 74 · 访问量 18万+

私信关注

Linux基础篇，正则表达式