Grep 与 正则表达式

Grep

Grep (Global regular expression printing) 是一个功能强大的文本搜索工具,用于将正则表达式与文件,多个文件或输入流中的文本进行匹配,并把匹配的行打印出来。

语法
grep [OPTIONS] PATTERN [FILE…]
选项:
-n 显示行号
-i 忽略大小写
-r 递归搜索子目录
-v 反显示
-e 使用扩展正则表达式
–color 将匹配到的 PATTERN 以特殊颜色显示

示例
在 /etc/profile 文件中查找单词 after 并显示匹配到的行号,发现匹配到共有四行

[root@node001 ~]# grep -n after /etc/profile
16:            if [ "$2" = "after" ] ; then
42:    pathmunge /usr/local/sbin after
43:    pathmunge /usr/sbin after
44:    pathmunge /sbin after

正则表达式 (Regular Expression)

正则表达式由两种基本字符类型组成:原义(正常)文本字符和元字符(在正则表达式中具有特殊意义的专用字符)。正则表达式就是通过文本字符与元字符的组合,组成一个 “规则字符串” ,这个 “规则字符串” 用来表达对字符串的一种过滤逻辑(称作 “匹配” )。

  • 标准字符集
    注意区分大小写,大写是相反的意思
    \d 任意一个数字,0-9中的任意一个
    \w 任意一个字母、数字或下划线
    \s 空白符(空格、制表符、换行符)
    . 任意一个字符(除了换行符),如果要匹配包括 "\n"在内的所有字符,一般用[\s\S]

  • 自定义字符集合
    [ ]方括号匹配方式,能够匹配方括号中的任意一个字符
    [abc] 匹配a或b或c
    [^abc] 匹配除abc以外的任意一个字符
    [f-k] 匹配f~k之间的任意一个字符
    [^f-k0-3] 匹配f~k,0-3之外的任意一个字符

  • 量词
    修饰匹配次数的特殊符号
    {n} 表达式重复n次
    {m,n} 表达式至少重复n次,最多重复m次
    {m,} 表达式至少重复m次
    ? 匹配表达式0次或者1次,相当于{0,1}
    + 表达式至少出现1次,相当于{1,}
    * 表达式不出现或出现任意次,相当于{0,}

    匹配次数中的贪婪模式(匹配字符越多越好,默认)
    匹配次数中的非贪婪模式(匹配字符越少越好,修饰匹配次数的特殊符号后再加上一个?号)

  • 字符边界–“零宽”
    本组标记匹配的不是字符而是位置,符合某种条件的位置
    ^ 与字符串开始的地方匹配
    $ 与字符串结束的地方匹配
    \b 匹配一个单词边界

  • 选择符和分组
    | 分支结构 左右两边表达式之间"或"的关系
    () 捕获组
    (?:Expression) 非捕获组

  • 反向引用(\nnn)
    每一对()会分配一个编号,使用()的捕获根据左括号的顺序从 1 开始自动编号
    通过反向引用,可以对分组已捕获的字符串进行反向引用

  • 预搜索(零宽断言、环视)
    (?=exp) 断言自身出现的位置的后面能匹配表达式 exp
    (?!exp) 断言此位置的后面不能匹配表达式 exp
    (?<=exp) 断言自身出现的位置的前面能匹配表达式 exp
    (?<!exp) 断言此位置出现的前面不能匹配表达式 exp

发布了42 篇原创文章 · 获赞 11 · 访问量 3837

猜你喜欢

转载自blog.csdn.net/weixin_44584387/article/details/88411349