Einführung
Reguläre Ausdrücke sind ein leistungsstarkes und flexibles Werkzeug, das bei der Textsuche und -verarbeitung eine wichtige Rolle spielt. Kenntnisse in den gebräuchlichen Zeichen und Verwendungsmethoden regulärer Ausdrücke werden Entwicklern dabei helfen, Mustervergleiche und Zeichenfolgenoperationen effizienter durchzuführen. In diesem Artikel werden einige gängige Zeichen für reguläre Ausdrücke vorgestellt und einige praktische Fälle aufgeführt, um deren Anwendung besser zu verstehen.
1. Punkt (.)
Ein Punkt .
wird verwendet, um jedes Zeichen außer Zeilenumbruch zuzuordnen. Es wird häufig verwendet, um undefinierte Zeichen abzugleichen. Wenn der reguläre Ausdruck beispielsweise a.b
auf die Zeichenfolge „acb“ angewendet wird, stimmt er mit jedem Zeichen zwischen „a“ und „b“ überein.
2. Backslash (\)
Backslash \
wird verwendet, um Sonderzeichen zu maskieren, sodass sie ihre besondere Bedeutung verlieren und zu gewöhnlichen Zeichen werden. Beispielsweise \$100
könnte ein regulärer Ausdruck mit der Zeichenfolge „100“ übereinstimmen, wobei die Zeichenfolge „100“100“ -Zeichenfolge, in der das „ “-Symbol mit Backslash-Escapezeichen versehen ist, was darauf hinweist, dass das „$“-Zeichen selbst übereinstimmt.
3. Zeichenklasse ([])
Zeichenklassen []
werden verwendet, um eine Reihe von Zeichen anzugeben, die mit jedem dieser Zeichen übereinstimmen können. [aeiou]
Ein regulärer Ausdruck kann beispielsweise mit jedem kleingeschriebenen Vokal übereinstimmen.
4. Caret (^)
Wenn das Caret ^
in einer Zeichenklasse verwendet wird, bedeutet es, dass es mit jedem Zeichen außer dem angegebenen Zeichensatz übereinstimmt. Ein regulärer Ausdruck kann beispielsweise [^0-9]
mit jedem nicht numerischen Zeichen übereinstimmen.
5. Quantoren (*, +, ? und {})
Quantifizierer werden verwendet, um die Anzahl der Wiederholungen des vorherigen Inhalts anzugeben.
*
Zeigt null oder mehr Übereinstimmungen an.+
Zeigt eine oder mehrere Übereinstimmungen an.?
Stellt null oder eine Übereinstimmung dar.{n}
Zeigt eine exakt n-fache Übereinstimmung an.{n,}
Zeigt eine mindestens n-fache Übereinstimmung an.{n,m}
Zeigt die n- bis m-fache Übereinstimmung an.
a*b
Ein regulärer Ausdruck kann beispielsweise mit „b“, „ab“, „aab“ usw. übereinstimmen.
6. Fall
Hier sind einige gängige Beispiele für reguläre Ausdrücke:
E-Mail-Verifizierung
Mithilfe regulärer Ausdrücke ^\w+@\w+\.\w+$
kann überprüft werden, ob E-Mail-Adressen das richtige Format haben. Es erfordert, dass das Postfach aus einem oder mehreren Wortzeichen besteht, gefolgt von einem „@“-Symbol, gefolgt von einem oder mehreren Wortzeichen, dann einem Punkt und einem oder mehreren Wortzeichen.
Extraktion von Mobiltelefonnummern
Mit regulären Ausdrücken (\+86)?1[3-9]\d{9}
können Mobiltelefonnummern aus Text extrahiert werden, auch solche mit Ländervorwahlen. Unter diesen (\+86)?
kann die Landesvorwahl null oder einmal vorkommen, 1[3-9]
die erste Ziffer, die die Mobiltelefonnummer angibt, ist 1, und die zweite Ziffer ist eine beliebige Ziffer zwischen 3 und 9, die \d{9}
die folgenden 9 Ziffern angibt.
URL-Ersatz
Reguläre Ausdrücke (https?://\S+)
können verwendet werden, um URLs im Text abzugleichen und Ersetzungsvorgänge durchzuführen. Darunter (https?://\S+)
versteht man den Abgleich der nicht leeren Zeichenfolge, die mit „http://“ oder „https://“ beginnt, also den Abgleich mit der URL.
abschließend
In diesem Artikel werden die häufig verwendeten Zeichen regulärer Ausdrücke und einige praktische Anwendungsfälle vorgestellt. Die Beherrschung dieser gängigen Zeichen und Techniken wird Entwicklern helfen, Mustervergleiche und Zeichenfolgenoperationen effizienter durchzuführen. Reguläre Ausdrücke werden häufig in der täglichen Entwicklung verwendet, beispielsweise zur Datenüberprüfung, Textverarbeitung und Informationsextraktion. Ich hoffe, dass dieser Artikel den Lesern bei der Beherrschung und Anwendung regulärer Ausdrücke hilfreich sein wird.