正規表現をブリーフ

正規表現:また、正規表現(正規表現)として知られ、パターンマッチング技術、リテラル文字と記号は特別な意味の組成を有しています。ほとんどのテキスト処理ツールは、(linuxのgrepを、awkは、カット、sedは、などの下)、正規表現をサポートしています。私たちは可能な検索などの操作、置き換え、ピーリング、フィルタのテキストファイルへの適切な正規表現を構築することで。

人気の話はテキスト関連私たちが望むの連続で、その結果、いくつかの特定の機能と組み合わせて、テキストの限られた量を使用することが知られているこの特殊記号正規表現の形式による不確実ないくつかのテキストを拡大することが可能となります。

 


 

Benpianのみ、工具の実際の使用を伴うことなく(以下、REマッチングがREの実際の動作を指すREと呼ぶ)正規表現を説明します。

1:位置マーカーポジションマーカーアンカー(^、$)、位置REを識別するために使用される文字列は、デフォルトでは、マッチした文字REは、文字列が表示されます内の任意の場所にすることができます。

 ^:指定したテキストヘッダ文字列を開始する必要がありREに一致する、といった:「^ ABC」の行を開始一致させることができ、ABCへ;

 $:のような対象の文字列を、終了する必要がありテールマッチREテキストを指定します。「^ ABC」終了行におけるABCマッチ。

 

2:識別子:すなわち、特定の文字照合を指定します。

任意の1個の文字C:Cは唯一のREのみの文字を一致させることができ、文字Cを一致させることができます。

 :マッチ任意の1つのような文字、:。ABCは一致してABCDabczに、 しかし一致しないABCDEをabcdzx、唯一の単一の文字を一致させることができます。

 []:マッチングは任意ブラケット1つの文字を、ブラケットのような文字セットまたは文字の範囲であってもよい:[DE] ABC一致ABCDABCEABC [0-9]であることができるマッチabc0ABC3abc9等。

 [^]で任意ブラケットと一致しない括弧のような文字セットまたは文字の範囲であってもよく、文字:ABC [^ 12である]と一致ABC3ABCDは、しかし一致させることはできませんABC1、ABC2を^ [0- 9] 一致させることができ、ABC、後続文字が任意の単一の数字ではありません。

 

3:改質剤の数:識別子は、一度に数回発生することがあり、または、改質剤の数を定義することができる表示されていないパターンの発生回数を

「?」のような:?マッチング(単一文字または識別子であってもよい)、その前に来た項目1または0:  ?ABC Dは、一致させることができABCDまたはABDが、一致することができないabccd

'+':+は、次のような彼の前の項目1回以上、一致:ABC +試合ABCABCCが、しかし、一致することはできませんAB&を

'*':*のような、彼の前で0回を複数のアイテムをマッチdは* abcの一致したABDABCDをabccdなど。

 {n}は次のようなマッチングアイテムの前にn回、:[0-9] {3}の任意の3桁と一致するが(123321 ...)、[0-9] {3}に拡張することができます[0- 9] [0-9] [0-9]

{N}:n回のアイテムのような、前に少なくとも一致する必要がある[0-9] {2}が 2桁の数字のいずれか2つ以上と一致します。

{N、M}:エントリのような、ほとんどのm回のマッチングで、少なくともn回一致する必要がある前に、[0-9] {2,5}が 5の数との間の2桁の数字のいずれかに一致させることができます。

 

補足:()全体としての内部のコンテンツとすることができる、|選択を示す、| Bは、(*の存在下でのマッチング一致として、エスケープ文字として表現、またはb(項目について、B)を\一致します。 。、^、$、+)\エスケープの前に追加することができ、特別な機能に署名。

 


 

いくつかの正規表現の例:

QQいいえマッチ:[1-9] [0-9] {9}、今やほとんどのQQ番号10。

一致IPアドレス:. [0-9] {1,3} \ [0-9] {1,3} \ [0-9] {1,3} \ [0-9] {1,3}この試合は、IPアドレスの有効性を確認することはできません。

任意の文字列に一致します* 

......

また、あなたはああを発見するための実用的なマッチングの多くの。

 

おすすめ

転載: www.cnblogs.com/hongbo-tao/p/11853643.html