正規表現(re.compile / re.match / re.split使い方)

1.正規表現

https://www.cnblogs.com/douzujun/p/7446448.html

2. re.compile

正規表現は、効率上の理由から、数千回、再利用する場合は、私たちができる正規表現をプリコンパイルは、この手順をコンパイルする必要がない場合、次の再利用、直接マッチング:

>>>インポート再
#编译:
>>> re_telephone = re.compile(R '^(\ D {3}) - (\ D {3,8})$') 使用:
>>> re_telephone.match( '010から12345')基() '010'、 '12345')
>>> re_telephone.match( '010から8086')。グループ() '010'、 '8086')

(1)使用1

(2)使用2

輸入
文字列 = ' <H1 CLASS = "タイトル"> test_douzi </ H1> <H1 CLASS = "タイトル"> test_douzi2 </ H1> <H1 CLASS = "タイトル"> test_douzi3 </ H1> ' 
パターン = " <H1クラス= "タイトル">(。*?)</ H1> " 
S = re.compile(パターン).findall(文字列)

 

3. re.split()

>>> ' ABC ' .split('  ' 
[ ' A '' B ''' '' ' C ' ] 
ああ、認識されていない連続したスペース、nは式試みる:

 >>>再.split(R&LT ' \ S + '' ABC ' 
[ ' A '' B '' C ' ] 
かかわらず、適切に分割することができるどのように多くのスペース。参加、試してください:

 >>>再。' A、B、CD ' 
[ ' A '' B '' C '' Dは' ] 
 を添加した。試してください。

 >>> re.split(R&LT ' [\ S \、\;] + ' ' A、B ;; CD ' 
[ ' A ' ' B ' ' C ' ' D ' ]

4. re.match()

>>> M = re.match(R ' ^(\ D {3}) - (\ D {3,8})$ '' 010から12345 '  >>> M
 <_sre.SRE_Matchオブジェクト。スパン=(0,9)、一致= ' 010から12345 ' > 
>>> m.group(0)
 ' 010から12345 ' 
>>> m.group(1 ' 010 ' 
>>> m.group(2 ' 12345 '

 

 

 

 

 

 

 

おすすめ

転載: www.cnblogs.com/douzujun/p/12241804.html