- 定期的な概念
- findAll一致検索方法
- メタ文字の使用と役割
正規表現のコンセプト
正規表現は、文字列の論理演算式であり、列は、フィルタの一種であります
これは、形式が一致するか否かを判断することができる所与
情報は、指定された文字列形式から抽出することができます
モジュールの再
findAllメソッド
文字列内のすべての正規表現にマッチした部分文字列を検索し、リストを返し、一致が見つからない場合は、空のリストが返されます
試合方法
文字列マッチングの開始位置から
一致が(このオブジェクトは、我々の試合についての情報を含む)一致するオブジェクトを返すマッチの開始位置が成功しない場合、一致()は空を返し、成功しています
それだけで抽出された文字インデックスと一致するグループ()マッチしたスパン(の内容を抽出するために)に合わせることができます
検索方法
文字列全体をスキャン、マッチが成功すると、(このオブジェクトは、私たちの試合に関する情報が含まれています)一致するオブジェクトを返します。
リターンのルールに沿って、発見にのみ一致を検索し、振り返ってみるとされていません
Re.matchと差re.search
re.match:文字列が正規表現を開始するために準拠していない場合、文字列の先頭から探し、試合はリターンが空、失敗します
re.search:あなたは空の戻りを見つけることができなかった場合は、文字列全体にマッチ
サブ方法
すべての文字列の一致が置き換えられ、操作しないで見つける元の文字列が返されませんでした
Re.Sは 『\ nを』を含め、文字列全体に拡張「」効果を表しつのパラメータを、持っています
メタキャラクタ
単一文字一致
。 (\ N-を除く)任意の1つの文字にマッチします []マッチ[]の文字が記載されています
\ D即ち0-9マッチ番号、 \ Dは、数、すなわち、非デジタルではない一致
\ sは空白の一致、すなわち、スペース、タブキー S \は非空白一致します
\ wは AZ、AZ、0-9、_すなわち、単語の文字にマッチし 、\ Wは、非単語の文字にマッチします
これは、メタ文字の数を表し、
* 文字は試合前にゼロまたは無限回現れる、それは不要です
+ 直前の文字が一回または無制限以上現れる、それは少なくとも1でマッチ
? 直前の文字を1またはnoneのいずれかがあることを、一回またはゼロ回以上現れるマッチ
{M}は 文字一致がm回前に発生します
{M} の文字が一致M前に少なくとも一度出現
{M、N} 前者一致する文字をn倍にMから見えます
これは、境界メタ文字を表し
^文字列の先頭にマッチします
$文字列一致の終わり
\ bは単語の境界と一致します
\ Bは非単語境界に一致します
パケットマッチング
| 任意の式の周りにマッチ
(AB) パケットとして括弧内の文字
貪欲と非欲張り
定期的なデフォルト貪欲パターンはマッチのデータ要件に合わせて可能な限り、つまり、データを一致させるために使用されています
非貪欲モードでは、常に最短マッチを探して
追加 ? 非欲張りモードです