Häufig verwendete Zeichen und Groß-/Kleinschreibung in regulären Ausdrücken

Einführung

Reguläre Ausdrücke sind ein leistungsstarkes und flexibles Werkzeug, das bei der Textsuche und -verarbeitung eine wichtige Rolle spielt. Kenntnisse in den gebräuchlichen Zeichen und Verwendungsmethoden regulärer Ausdrücke werden Entwicklern dabei helfen, Mustervergleiche und Zeichenfolgenoperationen effizienter durchzuführen. In diesem Artikel werden einige gängige Zeichen für reguläre Ausdrücke vorgestellt und einige praktische Fälle aufgeführt, um deren Anwendung besser zu verstehen.

1. Punkt (.)

Ein Punkt .wird verwendet, um jedes Zeichen außer Zeilenumbruch zuzuordnen. Es wird häufig verwendet, um undefinierte Zeichen abzugleichen. Wenn der reguläre Ausdruck beispielsweise a.bauf die Zeichenfolge „acb“ angewendet wird, stimmt er mit jedem Zeichen zwischen „a“ und „b“ überein.

2. Backslash (\)

Backslash \wird verwendet, um Sonderzeichen zu maskieren, sodass sie ihre besondere Bedeutung verlieren und zu gewöhnlichen Zeichen werden. Beispielsweise \$100könnte ein regulärer Ausdruck mit der Zeichenfolge „100“ übereinstimmen, wobei die Zeichenfolge „100“100“ -Zeichenfolge, in der das “-Symbol mit Backslash-Escapezeichen versehen ist, was darauf hinweist, dass das „$“-Zeichen selbst übereinstimmt.

3. Zeichenklasse ([])

Zeichenklassen []werden verwendet, um eine Reihe von Zeichen anzugeben, die mit jedem dieser Zeichen übereinstimmen können. [aeiou]Ein regulärer Ausdruck kann beispielsweise mit jedem kleingeschriebenen Vokal übereinstimmen.

4. Caret (^)

Wenn das Caret ^in einer Zeichenklasse verwendet wird, bedeutet es, dass es mit jedem Zeichen außer dem angegebenen Zeichensatz übereinstimmt. Ein regulärer Ausdruck kann beispielsweise [^0-9]mit jedem nicht numerischen Zeichen übereinstimmen.

5. Quantoren (*, +, ? und {})

Quantifizierer werden verwendet, um die Anzahl der Wiederholungen des vorherigen Inhalts anzugeben.

  • *Zeigt null oder mehr Übereinstimmungen an.
  • +Zeigt eine oder mehrere Übereinstimmungen an.
  • ?Stellt null oder eine Übereinstimmung dar.
  • {n}Zeigt eine exakt n-fache Übereinstimmung an.
  • {n,}Zeigt eine mindestens n-fache Übereinstimmung an.
  • {n,m}Zeigt die n- bis m-fache Übereinstimmung an.

a*bEin regulärer Ausdruck kann beispielsweise mit „b“, „ab“, „aab“ usw. übereinstimmen.

6. Fall

Hier sind einige gängige Beispiele für reguläre Ausdrücke:

E-Mail-Verifizierung

Mithilfe regulärer Ausdrücke ^\w+@\w+\.\w+$kann überprüft werden, ob E-Mail-Adressen das richtige Format haben. Es erfordert, dass das Postfach aus einem oder mehreren Wortzeichen besteht, gefolgt von einem „@“-Symbol, gefolgt von einem oder mehreren Wortzeichen, dann einem Punkt und einem oder mehreren Wortzeichen.

Extraktion von Mobiltelefonnummern

Mit regulären Ausdrücken (\+86)?1[3-9]\d{9}können Mobiltelefonnummern aus Text extrahiert werden, auch solche mit Ländervorwahlen. Unter diesen (\+86)?kann die Landesvorwahl null oder einmal vorkommen, 1[3-9]die erste Ziffer, die die Mobiltelefonnummer angibt, ist 1, und die zweite Ziffer ist eine beliebige Ziffer zwischen 3 und 9, die \d{9}die folgenden 9 Ziffern angibt.

URL-Ersatz

Reguläre Ausdrücke (https?://\S+)können verwendet werden, um URLs im Text abzugleichen und Ersetzungsvorgänge durchzuführen. Darunter (https?://\S+)versteht man den Abgleich der nicht leeren Zeichenfolge, die mit „http://“ oder „https://“ beginnt, also den Abgleich mit der URL.

abschließend

In diesem Artikel werden die häufig verwendeten Zeichen regulärer Ausdrücke und einige praktische Anwendungsfälle vorgestellt. Die Beherrschung dieser gängigen Zeichen und Techniken wird Entwicklern helfen, Mustervergleiche und Zeichenfolgenoperationen effizienter durchzuführen. Reguläre Ausdrücke werden häufig in der täglichen Entwicklung verwendet, beispielsweise zur Datenüberprüfung, Textverarbeitung und Informationsextraktion. Ich hoffe, dass dieser Artikel den Lesern bei der Beherrschung und Anwendung regulärer Ausdrücke hilfreich sein wird.

Guess you like

Origin blog.csdn.net/qq_54123885/article/details/131975596