SHELL编程四剑客之Grep工具

全局搜索正则表达式(Global search regular expression(RE) ,GREP)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
我们可能看到别人不光使用grep,还有egrep、fgrep等扩展工具,目前Linux操作系统默认都是使用GNU版本的grep,它功能更加强大,它支持用-E或-F参数去使用egrep或fgrep。所以这里我们主要讲解grep工具。

Grep使用格式:

grep     -[参数]    '匹配内容'     Filename

Grep常用参数详解如下:

-a 						以文本文件方式搜索;
-c 						计算找到的符合行的次数;
-i 						忽略大小写;
-n 						顺便输出行号;
-v 						反向选择,即显示不包含匹配文本的所有行;
-h 						查询多文件时不显示文件名;
-l 						查询多文件时只输出包含匹配字符的文件名;
-s 						不显示不存在或无匹配文本的错误信息;
-E 						允许使用egrep扩展模式匹配。

易误点:

	学习Grep时,需要了解通配符、正则表达式两个概念,很多读者容易把彼此搞混淆,通配符
主要用在Linux的Shell命令中,常用于文件或者文件名称的操作,而正则表达式用于文本内容中
的字符串搜索和替换,常用在AWK、GREP、SED、VIM工具中对文本的操作。

通配符类型详解:

*						0个或者多个字符、数字;
?						匹配任意一个字符;
#						表示注解;
|						管道符号;
;						多个命令连续执行;
&						后台运行指令;
!						逻辑运算非;
[ ]						内容范围,匹配括号中内容;
{ }						命令块,多个命令匹配。

正则表达式详解:

*						前一个字符匹配0次或多次;
.						匹配除了换行符以外任意一个字符;
.*						代表任意字符;
^						匹配行首,即以某个字符开头;
$						匹配行尾,即以某个字符结尾;
(..) 					标记匹配字符;
[]						匹配中括号里的任意指定字符,但只匹配一个字符;
[^]						匹配除中括号以外的任意一个字符;
\						转义符,取消特殊含义;
\< 						锚定单词的开始;
\> 						锚定单词的结束;
{n}						匹配字符出现n次;
{n,}					匹配字符出现大于等于n次;
{n,m}					匹配字符至少出现n次,最多出现m次;
\w 						匹配文字和数字字符,不匹配符号;
\W 						\w的反置形式,匹配一个或多个非单词字符,匹配符号;
\b 						单词锁定符;
\s						匹配任何空白字符;
\d						匹配一个数字字符,等价于[0-9]//sed工具的正则与grep工具的正则有2个不一样,是{}和(),sed中应该是\{..\}和\(..\) .

grep实战演练:

grep  -c "test" 	     haha.txt	 统计test字符总行数;
grep  -i "TEST" 	     haha.txt	 不区分大小写查找TEST所有的行;
grep  -n "test" 	     haha.txt	 打印test的行及行号;
grep  -v "test" 	     haha.txt	 不打印test的行;
grep  "test[53]" 	     haha.txt	 以字符test开头,接5或者3的行;
grep  "^[^test]" 	     haha.txt	 显示输出行首不是test的行;
grep  "[Mm]ay" 	 		 haha.txt	 匹配M或m开头的行;
grep  "K…D" 		 	 haha.txt	 匹配K,三个任意字符,紧接D的行;
grep  "[A-Z][9]D"  		 haha.txt	 匹配大写字母,紧跟9D的字符行;
grep  "T{2,}" 	     haha.txt	 打印字符T字符连续出现2次以上的行;
grep  "T{4,6}" 	     haha.txt	 打印字符T字符连续出现4次及6次的行;
grep  -n "^$" 	 		 haha.txt	 打印空行的所在的行号;
grep  -vE "#|^$"      	 haha.txt    不匹配文件中的#和空行;

grep   --color -ra -E    "db|config|sql"  *  匹配包含db或者config或者sql的文件;
echo 192.168.2.1|egrep "^([0-9]{1,3}\.){3}([0-9]{1,3})$"   匹配IPV4地址。
//注:如果不加^和$,便不能精确匹配IPV4,而且这里未对ip地址的每一位的范围做限制。
发布了162 篇原创文章 · 获赞 142 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/weixin_44571270/article/details/104071841
今日推荐