1.正規表現
https://www.cnblogs.com/douzujun/p/7446448.html
2. re.compile
正規表現は、効率上の理由から、数千回、再利用する場合は、私たちができる正規表現をプリコンパイルは、この手順をコンパイルする必要がない場合、次の再利用、直接マッチング:
>>>インポート再 #编译: >>> re_telephone = re.compile(R '^(\ D {3}) - (\ D {3,8})$') #使用: >>> re_telephone.match( '010から12345')基() ('010'、 '12345') >>> re_telephone.match( '010から8086')。グループ() ('010'、 '8086')
(1)使用1
(2)使用2
輸入再 文字列 = ' <H1 CLASS = "タイトル"> test_douzi </ H1> <H1 CLASS = "タイトル"> test_douzi2 </ H1> <H1 CLASS = "タイトル"> test_douzi3 </ H1> ' パターン = " <H1クラス= "タイトル">(。*?)</ H1> " S = re.compile(パターン).findall(文字列)
3. re.split()
>>> ' ABC ' .split(' ' ) [ ' A '、' B '、'' 、'' 、' C ' ] ああ、認識されていない連続したスペース、nは式試みる: >>>再.split(R&LT ' \ S + '、' ABC ' ) [ ' A '、' B '、' C ' ] かかわらず、適切に分割することができるどのように多くのスペース。参加、試してください: >>>再。、' A、B、CD ' ) [ ' A '、' B '、' C '、' Dは' ] を添加した。試してください。 >>> re.split(R&LT ' [\ S \、\;] + ' ' A、B ;; CD ' ) [ ' A ' ' B ' ' C ' ' D ' ]
4. re.match()
>>> M = re.match(R ' ^(\ D {3}) - (\ D {3,8})$ '、' 010から12345 ' ) >>> M <_sre.SRE_Matchオブジェクト。スパン=(0,9)、一致= ' 010から12345 ' > >>> m.group(0) ' 010から12345 ' >>> m.group(1 ) ' 010 ' >>> m.group(2 ) ' 12345 '