正規表現
I.概要
を確認する
ウェブクローラを。
コンセプト:
構文形式の文字列。
機能
PCRE
1、互換性の定期的なPerl言語の構文。(ジャワC)
2、迅速、かつ効率的。
POSIX
1、効率が高くない
2、セキュリティ上のリスク。
3、窓を実行することはできません。
第二に、正規表現を適用
preg_match_all(文字列$パターン、文字列$件名、配列$マッチ)
定期的なマッチング:機能
パラメータ:
パターン正規表現
と一致する被写体ストリング
マッチの試合の結果
リターン:にマッチの数。
構文:
-デリミタ
-原子
-メタ文字
-パターン修飾子
-区切り文字は
、正規表現の区切り文字を持っている必要があります。数字、文字、下線に加えて、他の区切り文字として使用することができます。業界で最も一般的に使用される定積分「/」区切り文字がペアで表示されています。
-アトミック
原子は、正規表現の最小構成単位です。意味のあるものにするために正規表現は、少なくとも1個の原子が存在します。
、数字、文字、下線、すべての印刷文字は原子と呼ばれます。
B、非印刷文字。
\ nは改行
C、文字をエスケープする必要があります。特別な意味を持つ文字。たとえば:メタキャラクタ
D、原子は特別な意味を持っている
すべての数値を表す\ dを
\すべての非数値を表すDは
、\ワット数の文字を、アンダースコア
アルファベット、数字以外のW、\下線
\は、すべての空白表すよ
\のSの代表をすべての非空白
E、カスタム原子テーブル
など[]範囲指定原子:AZ全て小文字表す
AZは、すべて大文字を表す
0-9すべての数を表すが、
同時に複数を与えられてもよいですシンボル必要ではないとの間の間隔範囲、複数の範囲。
例えば:-Z0-9
カスタムテーブル原子^が非表す
。fは、任意の原子
要素文字
要素が文字原子を修正するために使用されます。
*修正原子が0回以上出現することができ表します。
+改変原子回または複数回発生する可能性があり表し。
?図1は、修飾された原子のための0回以上発生する可能性があります。
{M}は修飾原子がm回発生する可能性があり表します。
{N、M}は修飾原子が少なくともn回メートルまで存在していてもよい表します。
数N <=現れる<= M
{N}修飾原子が少なくとも起こり得るNほとんどは限定するものではない表し、
nは<数=起こる
|または
^、及び^と\修飾文字として開始の代表を\
$ \ Z $と\ Zの代表としては、文字の端部変性及び
()
サブモード-
マッチ範囲変更する-
-逆参照を
文字の境界を表し、Bおよび\ Bの\ Bの\ \ Bは、非文字の境界を表す
モード-修飾子
モード修飾子は、正規表現を変更するために使用されます。パターン修飾子は、外部区切り文字正規表現で書かれています。
I:鈍感な陽性発現ケース。
通常のメール検証の原則の画像:
正規登録検証原理の写真