シェルスクリプト - 正規表現(A)

正規表現の概念

正規表現は:単一の文字列の使用を記述するために、構文規則に一致する一連の文字列ライン
通常の文字や特殊文字のは、一般的に、PHP、Pythonの、彼女と他の省略形として、テキストエディタ、スクリプトで使用されます正規表現は、正規表現は、強力なテキストマッチングが持つ、テキストの置換パターンに沿って、取得することで
、テキストここの海に迅速かつ効率的に処理することができます

基本的な正規表現

正規表現と正規表現への発現法列は、実質的にストリンジェントな機能の程度に応じて正規表現を拡張しました。基本的な正規表現は、一般的に、正規表現の最も基本的なのいくつかで使用されています。Linuxシステムで一般的なファイル処理ツールのgrepと基本正規表現とのegrepをサポートするためのsedやawkが拡張正規表現をサポートしています。

メタキャラクタの概要

$   匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则“$”也匹配‘\n’
或‘\r’。要匹配“$”字符本身,请使用“\$”
.   匹配除“\r\n”之外的任何单个字符
\   将下一个字符标记为特殊字符、原义字符、向后引用、八进制转义符。例如,‘n’匹配字符“n”。 ‘\n’匹配换行符。序列‘\\’匹配“\”,而‘\(’则匹配“(”
*   匹配前面的子表达式零次或多次。要匹配“*”字符,请使用“\*”
[]  字符集合。匹配所包含的任意一个字符。例如,“[abc]”可以匹配“plain”中的“a”
[^] 赋值字符集合。匹配未包含的一个任意字符。例如,“[^abc]”可以匹配“plain”中“plin”中的任何一个字母
[n1-n2] 字符范围。匹配指定范围内的任意一个字符。例如,“[a-z]”可以匹配“a”到“z”范围内的任意一个小写字母字符。
注意:只有连字符(-)在字符组内部,并且出现在两个字符之间时,才能表示字符的范围;如
果出现在字符组的开头,则只能表示连字符本身
{n} n 是一个非负整数,匹配确定的 n 次。例如,“o{2}”不能匹配“Bob”中的“o”,但是能匹配“food”中的两个 o
{n,}    n 是一个非负整数,至少匹配 n 次。例如,“o{2,}”不能匹配“Bob”中的“o”,但能匹配“foooood”中的所有 o。“o{1,}”等价于“o+”。“o{0,}”则等价于“o*”
{n,m}   m 和n 均为非负整数,其中 n<=m,最少匹配 n 次且最多匹配 m 次

Linuxのテキスト処理ツール

グレップ(フィルタが、正規表現をサポートしていません)
のegrepは、(正規表現をサポート)
(ラインフィルタ)のsed
awkは(列フィルタ)

実用的なデモ


次のようにまず、テストファイルtest.txtというファイルの内容のために必要な操作を作成し、名前を付けます

1)特定の文字を見つけるために
あなたがtest.txtというファイルから特定の文字「神」の場所を見つけるために、次のコマンドを実行することができますように、特定の文字を見つけるためには、非常に簡単です。ここで「-n」は、表示行数を表し、「 - i」は大文字と小文字を区別を表します。コマンドが実行された後、文字が一致基準を満たし、赤にフォントの色の変更

[root@localhost ~]# grep -n 'god' test.txt  //过滤txt文件中有'god'的单词并显示行数
8:god
16:abcgo
[root@localhost ~]# 
[root@localhost ~]# grep -in 'god' test.txt //过滤文件中以大写或者小写为开头的'god'单词并显示行数
8:god
15:God
16:abcgod

2)、ブラケットの使用は、「[]」の文字のコレクションを検索します

[root@localhost ~]# grep -n 'go[bc]l' test.txt 
12:gobl
13:gocl

単語検索を繰り返すには

[root@localhost ~]# grep -n 'oo' test.txt 
9:good
10:goooood

逆引き、逆を選択することにより、文字の後、ちょうどコレクションを達成するために「[^]」の目的を達成するために

[root@localhost ~]# grep -n '[^g]oo' test.txt //过滤不以“g”为开头但是带有“oo”的单词
2:loood
3:lood

所望の「○○」は、小文字の前に存在する場合、「grepの-N「[^ AZ] oo'test.txt」コマンドを使用することができる実装され、前記 『AZ』は 『AZ』〜図小文字、大文字を表します。

[root@localhost ~]# grep -n '[^a-z]oo' test.txt 
5:Goood
6:Good
[root@localhost ~]# grep -n '[^A-Z]oo' test.txt 
2:loood
3:lood
4:good

行番号が「はgrep -N 『[0-9]』のtest.txt」コマンドによって達成することができる認めます

[root@localhost ~]# grep -n '[0-9]' test.txt 
10:abc12345
12:12345

3)「$」行の文字の最初の行に「^」と終了を探します

[root@localhost ~]# grep -n '^g' test.txt   //查看以“g”为开头的单词
1:gd
4:good
7:gola
8:gobl
9:gocl
[root@localhost ~]# grep -n 'l$' test.txt    //查看以“l”结尾的单词
8:gobl
9:gocl
**若要查询以小写字母开头的行可以通过'^[a-z]'规则来过滤,查询大写字母开头的行则使用“^[A-Z]”规则,若查询不以字母开头的行则使用“^[^a-zA-Z]”规则。**
[root@localhost ~]# grep -n '^[a-z]' test.txt  //过滤以小写字母为开头的单词
1:gd
2:loood
3:lood
4:good
7:gola
8:gobl
9:gocl
10:abc12345
[root@localhost ~]# grep -n '^[A-Z]' test.txt //过滤以大写字母为开头的单词
5:Goood
6:Good
11:God
[root@localhost ~]# grep -n '^[^a-zA-Z]' test.txt //过滤不以字母开头规则
12:12345

行の終わりに小数点(。)にクエリを達成するために、次のコマンドを実行します。小数点(。)は、正規表現では、メタ文字なので、ので、ここで文字は普通の文字に特別な意味を変換している「\」エスケープ文字を使用する必要があります。

[root@localhost ~]# grep -n '\.$' test.txt 
abc12345.
God.
12345.

場合は、クエリ空白行、「グレップの-n 『^ $』 test.txtの」コマンドの実装

[root@localhost ~]# grep -n '^$' test.txt 
15:

* 4)、任意の文字を探してください。「」繰り返し文字「」、例えば、次のコマンドは、「G ?? L」の文字列を見つけることができ、それは、G Lの最後に始まり、4つの文字の合計です。**

[root@localhost ~]# grep -n 'g..l' test.txt 
8:gobl
9:gocl

あなたがOO、OOO、oooooが、などを照会したい場合は、アスタリスク(使用する必要があります)メタキャラクタを。しかし、それは「」と指摘し、繰り返し直前の単一文字のゼロ個以上を表します。「Oは、それがゼロ(すなわちヌル文字)を有していること」「-n'oのgrepを、NULL文字を許可行うように、「O」文字以上で表すコマンドテキストを有することになるすべてのコンテンツ「test.txtの」は印刷出力。それは「○○である場合」の両方等、O、OO、OOO、OOO、情報を含むように、第1のOが存在している必要があり、及び第二oは、ゼロまたはそれ以上のOで標準的です。同様に、クエリ文字列は、O、少なくとも二つ以上の実行「のgrepの-n'ooo含まれている場合は「test.txtの」コマンドを使用します。

[root@localhost ~]# grep -n 'ooo*' test.txt 
2:loood
3:lood
4:good
5:Goood
6:Good

クエリG Lの終始、少なくとも一つの中間文字列を含むO、次のコマンドを実現することができます

[root@localhost ~]# grep -n 'goo*d' test.txt 
4:good
5:gooood
6:goood

最後には、クエリ文字列D gを、任意の中間文字で始まります

[root@localhost ~]# grep -n 'g.*d' test.txt 
1:gd
4:good
5:gooood
6:goood

任意の数の行を照会

[root@localhost ~]# grep -n '[0-9][0-9]*' test.txt 
12:abc12345.
14:12345.

5)「}、{」連続した文字の範囲を検索
我々は、繰り返し文字の無限にゼロを設定する「」と『*』を使用し、 『{}』 『}、{』シェルで特別な意味を持っているので、使用文字は、通常の文字にエスケープ文字「\」、「{}」文字を使用する必要がある場合。
(1)Oクエリ2つの文字

[root@localhost ~]# grep -n 'o\{2\}' test.txt 
2:loood
3:lood
4:good
5:gooood
6:goood
7:Goood
8:Good

Oの文字列を含む(2)のG L端で開始するクエリを、中間体2-5

[root@localhost ~]# grep -n 'go\{2,5\}d' test.txt 
4:good
5:goooood
6:goood

(3)、D wは2以上のOを含む中間文字列を開始するクエリで終了

[root@localhost ~]# grep -n 'go\{2,\}d' test.txt 
4:good
5:goooood
6:goood

拡張正規表現

egrepのコマンドプロンプトは、単一の文字、文字列、単語であってもよい、検索文字列は、1つまたは複数のファイルであってもよいし、このコマンド文字列と任意のシンボルファイルの検索を使用することができ、ファイル検索モードが得られています文。

+   作用:重复一个或者一个以上的前一个字符

示例:执行“egrep -n 'wo+d' test.txt”命令,即可查询"wood" "woood" "woooooood"等字符串
?   作用:零个或者一个的前一个字符

示例:执行“egrep -n 'bes?t' test.txt”命令,即可查询“bet”“best”这两个字符串
|   作用:使用或者(or)的方式找出多个字符

示例:执行“egrep -n 'of|is|on' test.txt”命令即可查询"of"或者"if"或者"on"字符串
()  作用:查找“组”字符串
示例:“egrep -n 't(a|e)st' test.txt”。“tast”与“test”因为这两个单词的“t”与“st”是重复的,所以将“a”与“e”列于“()”符号当中,并以“|”分隔,即可查询"tast"或者"test"字符串
()+ 作用:辨别多个重复的组

示例:“egrep -n 'A(xyz)+C' test.txt”。该命令是查询开头的"A"结尾是"C",中间有一个以上的 "xyz"字符串的意思

一つ前の文字を繰り返し

[root@localhost ~]# egrep -n 'go+d' test.txt 
4:good
5:goooood
6:goood

ゼロまたは直前の文字の1

[root@localhost ~]# egrep -n 'go?d' test.txt 
1:gd

または方法は、複数の文字を見つけるために(または)を使用するには

[root@localhost ~]# egrep -n 'ol|ob' test.txt 
9:gola
10:gobl

「グループ」の文字列を検索します

[root@localhost ~]# egrep -n 'go(b|c)l' test.txt 
10:gobl
11:gocl

反復する複数のグループを識別する

[root@localhost ~]# egrep -n 'g(abc)+d' test.txt 
2:gabcd
3:gabcabcd

SEDツール

SEDは、強力かつシンプルなテキスト分析と変換ツールである、テキストが読み、そして唯一の指定された条件(など、移動、削除、置き換え、追加)、最終的な出力またはに応じてテキストを編集することができ、出力処理のすべての行の一部。sedはまた、相互作用が存在しない状態で、かなり複雑なテキスト処理操作を達成することができ、シェル・スクリプトは、広く様々な自動処理タスクを実装するために使用されています。
三つのプロセスを、読んで実行し、表示するなど、sedのワークフロー。
読み出し:入力ストリームのコンテンツ(ファイル、パイプ、標準入力)から行を読み取り、一時バッファに記憶されたSED

(また、モデル空間として知られ、パターンスペース)レッドゾーン。
実行:デフォルトでは、すべてのsedコマンドが他のsedコマンドは、すべての行に対して実行され、行のアドレス指定のない限り、パターンスペースに順次実行されます。
ディスプレイ:出力ストリームに変更内容を送信します。データを再送信した後、パターンスペースがクリアされます。
ファイルのすべての内容が処理されるまで内容のすべてが処理されるまで、上記の処理が繰り返し行われます。

1. sedコマンド一般的な使用は、
sedコマンドを起動し、以下に示すように、典型的には、2つの形態をとります。スクリプトファイルが表示されたときに、指定されたスクリプトファイルは、オプション『-f』スクリプトファイルの必要性を表し、「パラメータ」とは、オブジェクトと複数の動作、カンマでファイルは「」分離されたターゲットファイル操作をいい、ここターゲットファイルの前に、ターゲットファイルの表現は、指定されたスクリプトファイルを介して入力を処理するとき。
フォーマットは、SED
sedの[オプション] '操作'パラメータ
sedの[オプション] -fスクリプトファイルのパラメータ

一般的なsedコマンドのオプションは、主に以下のものが含まれます。
または-e --expression =:入力テキスト・ファイルを処理するために指定されたコマンドまたはスクリプトによって表されます。
-fまたは--file =:テキスト入力ファイルを処理するために指定されたスクリプトファイルによって表されます。
-hまたは--help:ヘルプを表示します。
-n、 -静かなサイレント:表示のみ処理結果を表しています。
-i:直接テキストファイルを編集します。

ライン間の操作した場合、一般的な操作は、以下のものが挙げられます。
:増加は、現在の行の下にコンテンツを指定する行を追加します。
C:指定されたコンテンツの選択された行を置き換え、置き換えます。
D:選択した行を削除するには削除します。
I:挿入し、選択された行の指定されたコンテンツの上に行を挿入します。

P:プリント、もしながら指定されたライン、プリント指定した行は、指定されていない場合、すべての印刷内容を行、印刷できない文字がある場合、ASCIIコードの出力が配置します。これは通常「-n」オプションと組み合わせて使用されています。
S:指定された文字を置換し、交換してください。
Y:文字変換。

出力整合テキスト(pは通常の出力を示します)

[root@localhost ~]# sed -n 'p' test.txt   //输出所有内容
godg
gabcd
gabcabcd
.....//省略部分内容
abc12345.
God.
12345.
[root@localhost ~]# sed -n '3p' test.txt  //输出第3行内容
gabcabcd
[root@localhost ~]# sed -n '3,5p' test.txt   //输出3~5行内容
gabcabcd
good
goooood
[root@localhost ~]# sed -n 'p;n' test.txt   //输出奇数行的内容
godg
gabcabcd
goooood
Goood
gola
gocl
God.
[root@localhost ~]# sed -n 'n;p' test.txt  //输出偶数行的内容
gabcd
good
goood
Good
gobl
abc12345.
12345.
[root@localhost ~]# sed -n '1,5{p;n}' test.txt   //输出1~5行内奇数行
godg
gabcabcd
goooood
[root@localhost ~]# sed -n '10,${n;p}' test.txt  //输出尾10行的偶数行 
gocl
God.

これらは、基本的な使用法のsedコマンド、正規表現と一緒にsedコマンドあり、フォーマットはわずかに異なっている、と正規表現は、「/」囲まれています。以下は、sedコマンドおよび例と関連して使用される正規表現です。

[root@localhost ~]# sed -n '/goo/p' test.txt  //输出包含"goo"的单词
good
goooood
goood
[root@localhost ~]# sed -n '4,/go/p' test.txt   //输出
good
goooood
[root@localhost ~]# sed -n '/go/=' test.txt   //输出包含"go"的所在行行数
1
4
5
6
9
10
11
[root@localhost ~]# sed -n '/^G/=' test.txt   //输入以"G"开开头的行数
7
8
13
[root@localhost ~]# sed -n '/\<good\>/p' test.txt   //输出包含单词"good"的行数
good

2)削除マッチングテキスト(D)

[root@localhost ~]# nl test.txt | sed '3d'  //删除了第三行
     1  godg
     2  gabcd
     4  good
     5  goooood
     6  goood
     7  Goood
[root@localhost ~]# nl test.txt | sed '3,5d' //删除第3行和第5行
     1  godg
     2  gabcd
     6  goood
     7  Goood
     8  Good
     9  gola
[root@localhost ~]# nl test.txt | sed '/good/d '   //删除"good"单词的行
     1  godg
     2  gabcd
     3  gabcabcd
     5  goooood
     6  goood
     7  Goood
[root@localhost ~]# sed '/^[a-z]/d' test.txt   //删除以小写字母开头的
Goood
Good
God.
12345.
[root@localhost ~]# sed '/\.$/d' test.txt   //删除以"."为结尾的字母
godg
gabcd
gabcabcd
good
goooood
goood
Goood
Good
gola
gobl
gocl
[root@localhost ~]# sed '/^$/d' test.txt   //删除空行
godg
gabcd
gabcabcd
good
goooood
goood
Goood
Good
gola
gobl
gocl
abc12345.
God.
12345.

3)予選テキストを置き換えます

sed 's/the/THE/' test.txt   //将每行中的第一个the 替换为 THE 
sed 's/l/L/2' test.txt  //将每行中的第 3 个l 替换为L 
sed 's/the/THE/g' test.txt  //将文件中的所有the 替换为THE
sed 's/o//g' test.txt   //将文件中的所有o 删除(替换为空串)
sed 's/^/#/' test.txt   //在每行行首插入#号
sed '/the/s/^/#/' test.txt      //在包含the 的每行行首插入#号
sed 's/$/EOF/' test.txt     //在每行行尾插入字符串EOF 
sed '3,5s/the/THE/g' test.txt   //将第 3~5 行中的所有the 替换为 THE
sed '/the/s/o/O/g' test.txt //将包含the 的所有行中的o 都替换为 O

資格のテキストの4)移行

sed '/the/{H;d};$G' test.txt    //将包含the 的行迁移至文件末尾,{;}用于多个操作
sed '1,5{H;d};17G' test.txt //将第 1~5 行内容转移至第 17 行后
sed '/the/w out.file' test.txt  //将包含the 的行另存为文件out.file
sed '/the/r /etc/hostname' test.txt //将文件/etc/hostname 的内容添加到
//包含the 的每行以后
sed '3aNew' test.txt        //在第 3 行后插入一个新行,内容为 New 
sed '/the/aNew' test.txt    //在包含the 的每行后插入一个新行,内容为 New
sed '3aNew1\nNew2' test.txt //在第 3 行后插入多行内容,中间的\n 表示换行

5)スクリプトを使用してファイルを編集します

[root@localhost ~]# sed '1,5{H;d};7G' test.txt   //将1~5行内容转移至第七行之后
goood
Goood

godg
gabcd
gabcabcd
good
goooood
Good
gola
gobl
gocl
abc12345.
God.
12345.
[root@localhost ~]# vim local_only_ftp.sh #!/bin/bash
# 指定样本文件路径、配置文件路径
SAMPLE="/usr/share/doc/vsftpd-3.0.2/EXAMPLE/INTERNET_SITE/vsftpd.conf " 
CONFIG="/etc/vsftpd/vsftpd.conf"
# 备份原来的配置文件,检测文件名为/etc/vsftpd/vsftpd.conf.bak 备份文件是否存在, 若不存在则使用 cp 命令进行文件备份 
[ ! -e "$CONFIG.bak" ] && cp $CONFIG $CONFIG.bak # 基于样本配置进行调整,覆盖现有文件
sed -e '/^anonymous_enable/s/YES/NO/g' $SAMPLE > $CONFIG
sed -i -e '/^local_enable/s/NO/YES/g' -e '/^write_enable/s/NO/YES/g' $CONFIG grep "listen" $CONFIG || sed -i '$alisten=YES' $CONFIG
# 启动vsftpd 服务,并设为开机后自动运行
 systemctl restart vsftpd
systemctl enable vsftpd

awkのツール

awkは編集のための強力なツールであるのLinux / UNIXシステムでは、入力されたテキストは、行ずつ読み取られ、出力形式またはコンテンツフィルタ処理の要件を満たすために、指定されたパターンに応じてマッチングを見つけるために相互作用することができませんかなり複雑なテキスト操作を実施する場合には、広く自動化された、さまざまな構成タスクを完了するために、シェルスクリプトで使用されています。
1.共用AWK
コマンドAWK通常使用されるフォーマットは、以下に示され、前記単一引用符プラス括弧「{}」は操作のデータを処理するために設けられています。awkは、対象ファイルは、スクリプトを読んで「-f」によって処理することができ、目的のファイルを直接扱うことができます。

awk 选项 '模式或条件 {编辑指令}' 文件 1 文件 2 „   //过滤并输出文件符条件的内容
awk -f 脚本文件 文件 1 文件 2 „ //从脚本中调用编辑指令,过滤并输出内容

あなたは、列の/ etc / passwdのユーザ名、ユーザID、グループIDなどを見つけるために必要がある場合は、AWKに次のコマンドを実行

[root@localhost ~]# awk -F ':' '{print $1,$3,$5}' /etc/passwd
root 0 root
bin 1 bin
daemon 2 daemon
....//省略部分
awk 包含几个特殊的内建变量(可直接用)如下所示:
    FS:指定每行文本的字段分隔符,默认为空格或制表位。

    NF:当前处理的行的字段个数。
    NR:当前处理的行的行号(序数)。
    $0:当前处理的行的整行内容。
    $n:当前处理行的第 n 个字段(第 n 列)。
    FILENAME:被处理的文件名。
    RS:数据记录分隔,默认为\n,即每行为一条记录。
  1. 使用例
    1)出力テキスト行
awk '{print}' test.txt       //输出所有内容,等同于 cat test.txt
awk '{print $0}' test.txt   //输出所有内容,等同于 cat test.txt
awk 'NR==1,NR==3{print}' test.txt   //输出第 1~3 行内容
awk '(NR>=1)&&(NR<=3){print}' test.txt  //输出第 1~3 行内容
awk 'NR==1||NR==3{print}' test.txt  //输出第 1 行、第 3 行内容
awk '(NR%2)==1{print}' test.txt //输出所有奇数行的内容
awk '(NR%2)==0{print}' test.txt //输出所有偶数行的内容
awk '/^root/{print}' /etc/passwd    //输出以root 开头的行
awk '/nologin$/{print}' /etc/passwd//输出以 nologin 结尾的行
awk 'BEGIN {x=0} ; /\/bin\/bash$/{x++};END {print x}' /etc/passwd
//统计以/bin/bash 结尾的行数,等同于 grep -c "/bin/bash$" /etc/passwd 
awk 'BEGIN{RS=""};END{print NR}' /etc/squid/squid.conf
//统计以空行分隔的文本段落数

2)を押して、出力テキスト・フィールド

awk '{print $3}' test.txt   //输出每行中(以空格或制表位分隔)的第 3 个字段
awk '{print $1,$3}' test.txt    //输出每行中的第 1、3 个字段
awk -F ":" '$2==""{print}' /etc/shadow //输出密码为空的用户的shadow 记录
awk 'BEGIN {FS=":"}; $2==""{print}' /etc/shadow
//输出密码为空的用户的shadow 记录
awk -F ":" '$7~"/bash"{print $1}' /etc/passwd

おすすめ

転載: blog.51cto.com/14307755/2441459