pitão expressão regular (\ []) (c)

Escapar caracteres meta:

Barra invertida \ tem muitos usos na expressão regular.

Por exemplo, queremos procurar no texto abaixo, em frente ao ponto de todas as cadeias, inclui também apontam si.

Maçã verde 
laranja. Laranja 
bananas são amarelas

 Se escrever uma expressão regular . * , Você deve encontrar inteligente certo

Porque o ponto é um meta-caracter, parece diretamente na expressão regular, o que corresponde a um carácter único, não pode ser representado . O personagem em si média

Se queremos pesquisar o conteúdo em si contém meta-caracteres, podem ser precedidos por uma barra invertida

Aqui devemos usar esta expressão: . * \.

Exemplos, procedimento pitão é como se segue:

= Conteúdo '' 
'maçã verde 
laranja é laranja. 
Bananas são amarelas. 
' '' 
Import Re 
o p-re.compile = (r '* \ ..') 
para One in p.findall (Conteúdo): 
    Imprimir (um)

 Correspondem a uma determinada tipos de caracteres

resposta barra invertida, o que corresponde a um certo tipo de personagem

tais como

\ D entre 0-9 jogo qualquer caracter numérico, equivalente à expressão [0-9]

\ D corresponde a um carácter não é um número compreendido entre 0-9, equivalente à expressão [^ 0-9]

\ S corresponde a um carácter de espaço em branco incluindo espaço, tabulações, novas linhas equivalentes para a expressão [\ T \ n \ r \ f \ v]

\ S corresponde a um carácter não-vazia, equivalente à expressão [^ \ T \ n \ r \ f \ v]

\ W corresponde a quaisquer caracteres de texto, incluindo maiúsculas e minúsculas letras, números sublinhados, equivalente à expressão [a-zA-Z0-9_]

\ W corresponde a um carácter não-texto, equivalente à expressão [^ a-zA-Z0-9_]

Barra invertida também ser usado em colchetes, por exemplo [\ s,.] Jogo representa: qualquer caractere de espaço em branco, ou uma vírgula ou ponto

Por exemplo:

fonte = '' ' 
王亚辉
Tony 
刘文武
''' 
importação re 
p = re.compile (r '\ w {2,4}', RE.A) 
de impressão (p.findall (fonte)) 



'' '[' Tony ']' ''

  

 

colchetes - correspondem a determinados tipos

Os colchetes indicam que você quer combinar certos tipos de caracteres

tais como

[Abc] corresponde a qualquer um, b, c ou dentro de um personagem, equivalente a [AC]

[AC] meio - representa um intervalo de um a c

Se você quiser combinar todas as letras minúsculas, você pode usar [az]

Alguns metacharacters perdeu a magia entre colchetes, e torna-se o mesmo que os personagens comuns

Por exemplo,

[Akm.] Jogo akm. Que qualquer caractere

Aqui . Em parênteses não denotam corresponder a qualquer caractere, mas sim indica uma partida . Este personagem

posição inicial

^ Representando a posição inicial do texto correspondente

Se ele é um modo multi-linha, para indicar o início de cada posição da linha do texto correspondente

Por exemplo, o seguinte texto que deseja selecionar cada linha na frente de uma cadeia de caracteres vírgula, incluindo vírgulas se

Maçãs, maçã verde 
laranjas, laranja é laranja 
banana, amarelo da banana

 Você pode escrever uma expressão regular ^. *.

 

Se em colchetes ^ representa um não-conjunto de caracteres dentro dos parêntesis rectos ( [^ \ D] , o referido seleccionado carácter não-numéricos)

Por exemplo:

'a1b2c3d4e5' = conteúdo 
de importação re 
p = re.compile (R '[^ \ d]') 
para um em p.findall (teor): 
    impressão (uma) 

'' ' 
输出结果: 
uma 
b 
c 
d 
e 
'''

  

 

Acho que você gosta

Origin www.cnblogs.com/wxcx/p/12643156.html
Recomendado
Clasificación