Escapar caracteres meta:
Barra invertida \ tem muitos usos na expressão regular.
Por exemplo, queremos procurar no texto abaixo, em frente ao ponto de todas as cadeias, inclui também apontam si.
Maçã verde laranja. Laranja bananas são amarelas
Se escrever uma expressão regular . * , Você deve encontrar inteligente certo
Porque o ponto é um meta-caracter, parece diretamente na expressão regular, o que corresponde a um carácter único, não pode ser representado . O personagem em si média
Se queremos pesquisar o conteúdo em si contém meta-caracteres, podem ser precedidos por uma barra invertida
Aqui devemos usar esta expressão: . * \.
Exemplos, procedimento pitão é como se segue:
= Conteúdo '' 'maçã verde laranja é laranja. Bananas são amarelas. ' '' Import Re o p-re.compile = (r '* \ ..') para One in p.findall (Conteúdo): Imprimir (um)
Correspondem a uma determinada tipos de caracteres
resposta barra invertida, o que corresponde a um certo tipo de personagem
tais como
\ D entre 0-9 jogo qualquer caracter numérico, equivalente à expressão [0-9]
\ D corresponde a um carácter não é um número compreendido entre 0-9, equivalente à expressão [^ 0-9]
\ S corresponde a um carácter de espaço em branco incluindo espaço, tabulações, novas linhas equivalentes para a expressão [\ T \ n \ r \ f \ v]
\ S corresponde a um carácter não-vazia, equivalente à expressão [^ \ T \ n \ r \ f \ v]
\ W corresponde a quaisquer caracteres de texto, incluindo maiúsculas e minúsculas letras, números sublinhados, equivalente à expressão [a-zA-Z0-9_]
\ W corresponde a um carácter não-texto, equivalente à expressão [^ a-zA-Z0-9_]
Barra invertida também ser usado em colchetes, por exemplo [\ s,.] Jogo representa: qualquer caractere de espaço em branco, ou uma vírgula ou ponto
Por exemplo:
fonte = '' ' 王亚辉 Tony 刘文武 ''' importação re p = re.compile (r '\ w {2,4}', RE.A) de impressão (p.findall (fonte)) '' '[' Tony ']' ''
colchetes - correspondem a determinados tipos
Os colchetes indicam que você quer combinar certos tipos de caracteres
tais como
[Abc] corresponde a qualquer um, b, c ou dentro de um personagem, equivalente a [AC]
[AC] meio - representa um intervalo de um a c
Se você quiser combinar todas as letras minúsculas, você pode usar [az]
Alguns metacharacters perdeu a magia entre colchetes, e torna-se o mesmo que os personagens comuns
Por exemplo,
[Akm.] Jogo akm. Que qualquer caractere
Aqui . Em parênteses não denotam corresponder a qualquer caractere, mas sim indica uma partida . Este personagem
posição inicial
^ Representando a posição inicial do texto correspondente
Se ele é um modo multi-linha, para indicar o início de cada posição da linha do texto correspondente
Por exemplo, o seguinte texto que deseja selecionar cada linha na frente de uma cadeia de caracteres vírgula, incluindo vírgulas se
Maçãs, maçã verde laranjas, laranja é laranja banana, amarelo da banana
Você pode escrever uma expressão regular ^. *.
Se em colchetes ^ representa um não-conjunto de caracteres dentro dos parêntesis rectos ( [^ \ D] , o referido seleccionado carácter não-numéricos)
Por exemplo:
'a1b2c3d4e5' = conteúdo de importação re p = re.compile (R '[^ \ d]') para um em p.findall (teor): impressão (uma) '' ' 输出结果: uma b c d e '''