[python] ¡Módulo de expresión regular!

Una expresión regular es una secuencia especial de caracteres que puede ayudarle a comprobar fácilmente si una cadena coincide con un patrón determinado. Por eso hoy hablaré en detalle sobre el uso de expresiones regulares.

El módulo re permite que el lenguaje Python tenga todas las funciones de expresión regular. Tendremos una comprensión más profunda de las expresiones regulares de Python a través de las funciones básicas y los casos de uso del módulo re.

1. Configuración del entorno

Mi entorno Python es la versión 3.7.8 y la ruta de descarga es la siguiente:

1.python 3.7.8  

Puede ingresar directamente al sitio web oficial para descargar e instalar: Descargar Python | Python.org

2.La biblioteca se puede importar directamente

import re

2. Uso básico de la biblioteca.

1. Coincidencia de cadenas ordinarias

re.findll(): Devuelve datos en forma de lista. La lista son datos de cadena que cumplen con los requisitos habituales:

x = "qwer123\>"

y = re.findall('qwe',x)

print(y)

Producción:

Primero defina una variable x, asígnele un conjunto de datos de cadena, defina la variable y, use la función findll(), extraiga los datos de cadena que contienen 'qwe' en:

x = "qwer123qwer\>"

y = re.findall('qwe',x)

print(y)

Producción:

Se obtienen dos conjuntos de datos de tipo cadena 'qwe' en la variable x y se devuelven en forma de lista.

2. Coincidencia de metacaracteres (hablemos de algunos metacaracteres de uso común)

(1) []: se utiliza para especificar un juego de caracteres ([0~9]), que representa un rango (a[abcde]e).

Por ejemplo, si desea encontrar 'xyz' en la cadena 'xyzqwexyz', puede usar [] para escribir:

x = 'xyzqwexyz'

y = 'x[xyz]z'

z = re.findall(y,x)

print(z)

Producción:

(2) ^: Se utiliza principalmente para hacer coincidir el comienzo de la línea.

x = 'xyzqwexyz'

print(re.findall("^xy", x))

Producción:

(3)$: Se utiliza principalmente para hacer coincidir el final de la línea.

x = 'xyzqwexyz'

print(re.findall("yz$", x))

Producción:

(4) \s: coincide con cualquier carácter de espacio en blanco

x = 'xyz    yz'

print(re.findall("\s\s",x))

Producción:

(5)\w: coincide con cualquier guión alfanumérico y subrayado

x = "xh_xw-@*a"

print(re.findall("\w\w\w",x))

print(re.findall("\w\w\w\w\w",x))

Producción:

 

 

(6) \d: coincide con cualquier número decimal

x = 'ab214cd'

print(re.findall("b\d\d\dc", x))

Producción:

(7) *: Indica coincidir tanto como sea posible

x = '123456789'

print(re.findall("123\d*", x))

Producción:

(8): Indica operar cualquier carácter excepto los caracteres de nueva línea

x = '0123\n456-*\n@'

print(re.findall('.',x))

Producción:

3. Resumen

Después de dominar el uso de las funciones anteriores, básicamente podrá completar la coincidencia de cadenas. Debería ser más fácil de entender a través de un pequeño ejemplo de cada función.

@Neng

Supongo que te gusta

Origin blog.csdn.net/pengneng123/article/details/133384787
Recomendado
Clasificación