什么是正则表达式

正则表达式，又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法（英语：Regular Expression，在代码中常简写为regex、regexp或RE），是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里，正则表达式通常被用来检索、替换那些匹配某个模式的文本。

Regular Expression的“Regular”一般被译为“正则”、“正规”、“常规”。此处的“Regular”即是“规则”、“规律”的意思，Regular Expression即“描述某种规则的表达式”之意。

re模块的使用说明

导入re模块

import re

# 使用match方法进行匹配操作
result = re.match(正则表达式,要匹配的字符串)

# 如果上一步匹配到数据的话，可以使用group方法来提取数据
result.group()

re.match是用来进行正则匹配检查的方法，若字符串匹配正则表达式，则match方法返回匹配对象（Match Object），否则返回None（注意不是空字符串""）。
匹配对象Macth Object具有group方法，用来返回字符串的匹配部分。
#示例：

import  re   
result = re.match("ToBe","ToBeXX")

result.group()

运行结果为：
ToBe

#注：
re.match() 能够匹配出以xxx开头的字符串

表示字符

正则表达式的单字符匹配

. ---- 匹配任意1个字符（除了\n）
[ ] ---- 匹配[ ]中列举的字符
\d ---- 匹配数字，即0-9
\D ---- 匹配非数字，即不是数字
\s ---- 匹配空白，即空格，tab键
\S ---- 匹配非空白
\w ---- 匹配单词字符，即a-z、A-Z、0-9、_
\W ---- 匹配非单词字符
#示例1：

import re
ret = re.match(".","a")
ret.group()
>>a

ret = re.match(".","b")
ret.group()
>>b

ret = re.match(".","M")
ret.group()
>>M

#示例2：

import re

# 如果hello的首字符小写，那么正则表达式需要小写的h
ret = re.match("h","hello Python")
ret.group()
>> h


# 如果hello的首字符大写，那么正则表达式需要大写的H
ret = re.match("H","Hello Python")
ret.group()
>> H

# 大小写h都可以的情况
ret = re.match("[hH]","hello Python")
ret.group()
>> h
ret = re.match("[hH]","Hello Python")
ret.group()
>> H


# 匹配0到9第一种写法
ret = re.match("[0123456789]","7Hello Python")
ret.group()
>> 7

# 匹配0到9第二种写法
ret = re.match("[0-9]","7Hello Python")
ret.group()
>> 7

#示例3：

import re

# 普通的匹配方式
ret = re.match("嫦娥1号","嫦娥1号发射成功")
 ret.group()
 >>嫦娥1号

ret = re.match("嫦娥2号","嫦娥2号发射成功")
 ret.group()
 >>嫦娥2号

ret = re.match("嫦娥3号","嫦娥3号发射成功")
 ret.group()
 >>嫦娥3号

# 使用\d进行匹配
ret = re.match("嫦娥\d号","嫦娥1号发射成功")
ret.group()
>> 嫦娥1号

ret = re.match("嫦娥\d号","嫦娥2号发射成功")
ret.group()
>>嫦娥2号

ret = re.match("嫦娥\d号","嫦娥3号发射成功")
 ret.group()
 >>嫦娥3号

Python正则表达式学习笔记（1）

什么是正则表达式

re模块的使用说明

导入re模块

表示字符

正则表达式的单字符匹配

猜你喜欢