Pythonの正規表現(1) - 特殊文字
正規表現 - 表現は特別な意味
正規表現の文字と自分自身の数字が、文字と数字のほとんどは、バックスラッシュの前に別の意味を持つことになります。
以下は、特別な要素の正規表現パターンの構文を示しています。
1.通常の文字セット
1)\ wのマッチ英数字とアンダースコア
2)\ Wマッチ非英数字とアンダースコア
3)\ sが[\ T \ n \ R \ F]に相当する任意の空白文字と一致します。
4)\ Sは、任意の非空白文字にマッチします
5)\任意の数に一致するdは、[0-9]と等価です
6)\ Dは、任意の非数値と一致しました
7)\ 1 ... \ 9は、n番目のパケットにマッチします。
8)[a-zA-Z0-9]は、任意の文字と数字と一致します
文字の2数
あなたが抑制貪欲にマッチさせたい場合は文字の数は、例えば、追加された後、(...)文字または文字グループに続いて、デフォルトの貪欲なマッチング:? \ W +?
1)。改行以外の任意の文字にマッチし、re.DOTALLフラグが指定されている場合、任意の文字、改行含むと一致することができ
2)*直前の文字の0回以上にマッチ
3)+直前の文字の1回以上一致し
4)?直前の文字0又は1回にマッチ
5){M} m回前の文字にマッチします
前者一致する文字n回〜6){M、N} M
7){M}少なくともm回で試合前の文字
8){n}は前者一致する文字0倍Nに、最大n
3.境界マッチャ
1)^各ラインマッチの先頭のラインの複数の場合、文字列の先頭
2)[^] [...]であり、^は負、非アルファベット[^-ZA-Z]、[^ 0-9]非数値を表します
3)$文字列または行の末尾、マルチラインパターンマッチングであれば、各ラインの終わり
4)\ Aは^で、文字列の先頭にマッチします
5)\ bは、ワード境界と一致位置と単語との間の空間を意味します
6)\ Bと等価である[^ \ B非語境界整合を表します
ラップは改行と一致する文字列が存在する、唯一のフロントエンドである場合7)\ Zは、文字列の末尾に一致します。
8)\ Zマッチングストリング終了
4.論理マッチャー
1)|(または)
マッチングしない|ない、その範囲は括弧内にある場合、左の式は、マッチングが終了した場合、もはや一般的には記号()の右側にある正規表現にマッチする正規表現のいずれかについては、使用されています正規表現全体
2)パケット(...)
参照した後、「(」)囲まれた正規表現は、パケット、順次式の左側から数えてN、左括弧の数として使用される(使用し、多くのパケットがあり、コードする配列からのパケットプラス1、双方のブラケットネストされた括弧を、全体としてのパケットの発現は、数量詞の後にアクセスすることができます。
3)\ <番号>
\ 1 ... \ 9:文字列参照パケットは、として<番号>のパケット番号と一致します
4)(?P <name>が...)
デフォルトのパケット数パケットの再割り当て別名に加えて、グループを名前付き
注:Pは資産であります
5)(?P =名)
エイリアス名マッチング基準パケットは、これは、文字列の繰り返しに一致する正規表現で参照され、参照番号が使用されてもよいです。
注:Pは資産であります
5.特別マッチャ
?I、M、またはX:1)(IMX)の正規表現は、3つのオプションのフラグを含みます。それだけで地域の括弧に影響を与えます。
I、M、X、または任意のフラグをオフ2)(?-Imx)正規表現。それだけで地域の括弧に影響を与えます。
3)(?:...)カッコ内の文字列に一致するようにグループとしてしません
4)(?!パターン)負のアサーション構文の前に、それは負の始まりを表し、
パターンマッチング方式、正規表現の先頭でのみ使用することができ、それは、正規表現マッチの背中の内容と一致する必要はありませんだけで成功します
5)(?<!パターン)負のアサーション構文の後に、それは負の終わりを表し
パターンの前の内容は、成功した試合の前に必要なパターンと一致していません
6)アサーション構文の前に(?=パターン)は確かに。
Pattrenは確かに文字コンテンツいることを示し、成功裏にマッチするパターンに一致する必要があります
肯定的なアサーションの構文の後に7)(?<=パターン)
パターンマッチングの必要性が成功するパターンマッチングは、確かにコンテンツの背後にある文字を表します
コンテンツの背後にある8)(?#...)#はコメントとして扱われ、無視されます
正規表現 - 表現は特別な意味
正規表現の文字と自分自身の数字が、文字と数字のほとんどは、バックスラッシュの前に別の意味を持つことになります。
以下は、特別な要素の正規表現パターンの構文を示しています。
1.通常の文字セット
1)\ wのマッチ英数字とアンダースコア
2)\ Wマッチ非英数字とアンダースコア
3)\ sが[\ T \ n \ R \ F]に相当する任意の空白文字と一致します。
4)\ Sは、任意の非空白文字にマッチします
5)\任意の数に一致するdは、[0-9]と等価です
6)\ Dは、任意の非数値と一致しました
7)\ 1 ... \ 9は、n番目のパケットにマッチします。
8)[a-zA-Z0-9]は、任意の文字と数字と一致します
文字の2数
あなたが抑制貪欲にマッチさせたい場合は文字の数は、例えば、追加された後、(...)文字または文字グループに続いて、デフォルトの貪欲なマッチング:? \ W +?
1)。改行以外の任意の文字にマッチし、re.DOTALLフラグが指定されている場合、任意の文字、改行含むと一致することができ
2)*直前の文字の0回以上にマッチ
3)+直前の文字の1回以上一致し
4)?直前の文字0又は1回にマッチ
5){M} m回前の文字にマッチします
前者一致する文字n回〜6){M、N} M
7){M}少なくともm回で試合前の文字
8){n}は前者一致する文字0倍Nに、最大n
3.境界マッチャ
1)^各ラインマッチの先頭のラインの複数の場合、文字列の先頭
2)[^] [...]であり、^は負、非アルファベット[^-ZA-Z]、[^ 0-9]非数値を表します
3)$文字列または行の末尾、マルチラインパターンマッチングであれば、各ラインの終わり
4)\ Aは^で、文字列の先頭にマッチします
5)\ bは、ワード境界と一致位置と単語との間の空間を意味します
6)\ Bと等価である[^ \ B非語境界整合を表します
ラップは改行と一致する文字列が存在する、唯一のフロントエンドである場合7)\ Zは、文字列の末尾に一致します。
8)\ Zマッチングストリング終了
4.論理マッチャー
1)|(または)
マッチングしない|ない、その範囲は括弧内にある場合、左の式は、マッチングが終了した場合、もはや一般的には記号()の右側にある正規表現にマッチする正規表現のいずれかについては、使用されています正規表現全体
2)パケット(...)
参照した後、「(」)囲まれた正規表現は、パケット、順次式の左側から数えてN、左括弧の数として使用される(使用し、多くのパケットがあり、コードする配列からのパケットプラス1、双方のブラケットネストされた括弧を、全体としてのパケットの発現は、数量詞の後にアクセスすることができます。
3)\ <番号>
\ 1 ... \ 9:文字列参照パケットは、として<番号>のパケット番号と一致します
4)(?P <name>が...)
デフォルトのパケット数パケットの再割り当て別名に加えて、グループを名前付き
注:Pは資産であります
5)(?P =名)
エイリアス名マッチング基準パケットは、これは、文字列の繰り返しに一致する正規表現で参照され、参照番号が使用されてもよいです。
注:Pは資産であります
5.特別マッチャ
?I、M、またはX:1)(IMX)の正規表現は、3つのオプションのフラグを含みます。それだけで地域の括弧に影響を与えます。
I、M、X、または任意のフラグをオフ2)(?-Imx)正規表現。それだけで地域の括弧に影響を与えます。
3)(?:...)カッコ内の文字列に一致するようにグループとしてしません
4)(?!パターン)負のアサーション構文の前に、それは負の始まりを表し、
パターンマッチング方式、正規表現の先頭でのみ使用することができ、それは、正規表現マッチの背中の内容と一致する必要はありませんだけで成功します
5)(?<!パターン)負のアサーション構文の後に、それは負の終わりを表し
パターンの前の内容は、成功した試合の前に必要なパターンと一致していません
6)アサーション構文の前に(?=パターン)は確かに。
Pattrenは確かに文字コンテンツいることを示し、成功裏にマッチするパターンに一致する必要があります
肯定的なアサーションの構文の後に7)(?<=パターン)
パターンマッチングの必要性が成功するパターンマッチングは、確かにコンテンツの背後にある文字を表します