Pythonの定期的な、モジュールを再

  1. 定期的な概念
  2. findAll一致検索方法
  3. メタ文字の使用と役割

正規表現のコンセプト

正規表現は、文字列の論理演算式であり、列は、フィルタの一種であります

これは、形式が一致するか否かを判断することができる所与

情報は、指定された文字列形式から抽出することができます

 

 

 

モジュールの再

findAllメソッド

文字列内のすべての正規表現にマッチした部分文字列を検索し、リストを返し、一致が見つからない場合は、空のリストが返されます

 

試合方法

文字列マッチングの開始位置から

一致が(このオブジェクトは、我々の試合についての情報を含む)一致するオブジェクトを返すマッチの開始位置が成功しない場合、一致()は空を返し、成功しています

それだけで抽出された文字インデックスと一致するグループ()マッチしたスパン(の内容を抽出するために)に合わせることができます

 

検索方法

文字列全体をスキャン、マッチが成功すると、(このオブジェクトは、私たちの試合に関する情報が含まれています)一致するオブジェクトを返します。

リターンのルールに沿って、発見にのみ一致を検索し、振り返ってみるとされていません

 

Re.matchと差re.search

re.match:文字列が正規表現を開始するために準拠していない場合、文字列の先頭から探し、試合はリターンが空、失敗します

re.search:あなたは空の戻りを見つけることができなかった場合は、文字列全体にマッチ

 

サブ方法

すべての文字列の一致が置き換えられ、操作しないで見つける元の文字列が返されませんでした

 

Re.Sは 『\ nを』を含め、文字列全体に拡張「」効果を表しつのパラメータを、持っています

 

 

 

メタキャラクタ

単一文字一致 

。 (\ N-を除く)任意の1つの文字にマッチします           []マッチ[]の文字が記載されています

\ D即ち0-9マッチ番号、              \ Dは、数、すなわち、非デジタルではない一致

\ sは空白の一致、すなわち、スペース、タブキー          S \は非空白一致します

\ wは AZ、AZ、0-9、_すなわち、単語の文字にマッチし    、\ Wは、非単語の文字にマッチします

 

これは、メタ文字の数を表し、

*                文字は試合前にゼロまたは無限回現れる、それは不要です  

             直前の文字が一回または無制限以上現れる、それは少なくとも1でマッチ  

?               直前の文字を1またはnoneのいずれかがあることを、一回またはゼロ回以上現れるマッチ

{M}は              文字一致がm回前に発生します

{M}             の文字が一致M前に少なくとも一度出現

{M、N}           前者一致する文字をn倍にMから見えます

 

これは、境界メタ文字を表し

^文字列の先頭にマッチします

$文字列一致の終わり

\ bは単語の境界と一致します

\ Bは非単語境界に一致します

 

パケットマッチング

|      任意の式の周りにマッチ

(AB)   パケットとして括弧内の文字

 

 

 

貪欲と非欲張り

定期的なデフォルト貪欲パターンはマッチのデータ要件に合わせて可能な限り、つまり、データを一致させるために使用されています

非貪欲モードでは、常に最短マッチを探して

追加    非欲張りモードです

 

おすすめ

転載: www.cnblogs.com/jiyu-hlzy/p/11772788.html