Python正则表达式学习笔记(1)

什么是正则表达式

正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本。

Regular Expression的“Regular”一般被译为“正则”、“正规”、“常规”。此处的“Regular”即是“规则”、“规律”的意思,Regular Expression即“描述某种规则的表达式”之意。

re模块的使用说明

导入re模块

import re

# 使用match方法进行匹配操作
result = re.match(正则表达式,要匹配的字符串)

# 如果上一步匹配到数据的话,可以使用group方法来提取数据
result.group()

re.match是用来进行正则匹配检查的方法,若字符串匹配正则表达式,则match方法返回匹配对象(Match Object),否则返回None(注意不是空字符串"")。
匹配对象Macth Object具有group方法,用来返回字符串的匹配部分。
#示例

import  re   
result = re.match("ToBe","ToBeXX")

result.group()

运行结果为:
ToBe

#注:
re.match() 能够匹配出以xxx开头的字符串

表示字符

正则表达式的单字符匹配

. ---- 匹配任意1个字符(除了\n)
[ ] ---- 匹配[ ]中列举的字符
\d ---- 匹配数字,即0-9
\D ---- 匹配非数字,即不是数字
\s ---- 匹配空白,即 空格,tab键
\S ---- 匹配非空白
\w ---- 匹配单词字符,即a-z、A-Z、0-9、_
\W ---- 匹配非单词字符
#示例1:

import re
ret = re.match(".","a")
ret.group()
>>a

ret = re.match(".","b")
ret.group()
>>b

ret = re.match(".","M")
ret.group()
>>M

#示例2:

import re

# 如果hello的首字符小写,那么正则表达式需要小写的h
ret = re.match("h","hello Python")
ret.group()
>> h


# 如果hello的首字符大写,那么正则表达式需要大写的H
ret = re.match("H","Hello Python")
ret.group()
>> H

# 大小写h都可以的情况
ret = re.match("[hH]","hello Python")
ret.group()
>> h
ret = re.match("[hH]","Hello Python")
ret.group()
>> H


# 匹配0到9第一种写法
ret = re.match("[0123456789]","7Hello Python")
ret.group()
>> 7

# 匹配0到9第二种写法
ret = re.match("[0-9]","7Hello Python")
ret.group()
>> 7

#示例3:

import re

# 普通的匹配方式
ret = re.match("嫦娥1号","嫦娥1号发射成功")
 ret.group()
 >>嫦娥1号

ret = re.match("嫦娥2号","嫦娥2号发射成功")
 ret.group()
 >>嫦娥2号

ret = re.match("嫦娥3号","嫦娥3号发射成功")
 ret.group()
 >>嫦娥3号

# 使用\d进行匹配
ret = re.match("嫦娥\d号","嫦娥1号发射成功")
ret.group()
>> 嫦娥1号

ret = re.match("嫦娥\d号","嫦娥2号发射成功")
ret.group()
>>嫦娥2号

ret = re.match("嫦娥\d号","嫦娥3号发射成功")
 ret.group()
 >>嫦娥3号

猜你喜欢

转载自blog.csdn.net/weixin_43637570/article/details/87968088