正则表达式知识整理 - 代码天地

正则表达式知识整理

其他 2018-11-19 14:57:57 阅读次数: 0

注：本文所有的例子都来自于《正则表达式必知必会（修订版）》。

正则表达式的作用是用来检索文本或替换文本。如：

（绝大多数正则表达式引擎的默认行为是返回第1个匹配结果。）

正则表达式中一个非常重要的概念就是元字符，你可以不用去理什么限定符、定位符之类，只要记住它们都是元字符就行。

基本元字符

元字符	说明
\|	逻辑或操作符
\	转义符
.	匹配单个任意字符。如果想匹配多个，就用多个.
[]	字符区间。如[0123456789]，则匹配0或1或2或3或4...
[ - ]	连字符。如[0-9]等价于[0123456789]。
[^ ]	取非。取非字符区间，如[^0-9]，则匹配非数字。

基本元字符（\）

基本元字符（.）

基本元字符（[]）

基本元字符（[ - ]）

基本元字符（[^ ]）

数量元字符

元字符	说明
？	匹配前一个字符0次或1次
*	匹配前一个字符0次或多次
+	匹配前一个字符1次或多次
{n}	匹配前一个字符n次
{n,m}	匹配前一个字符至少n次至多m次
{n,}	匹配前一个字符至少n次

数量元字符（?）

数量元字符（*）

数量元字符（+）

数量元字符（{n}）

数量元字符（{n,m}）

数量元字符（{n,}）

贪婪型

正则表达式中的元字符有一些是贪婪型的，它会从文本的开头一直匹配到文本的结尾，忽略中间的匹配。看一个例子或许你就会明白：

上面的匹配结果肯定不是我们所期望的。

贪婪型元字符	懒惰型元字符
*	*?
+	+?
{n,}	{n,}?

位置元字符

元字符	说明
^	匹配字符串的开头
$	匹配字符串的结尾
\b	匹配单词边界（开头和结尾）
\B	匹配非单词边界

位置元字符（^）

位置元字符（$）

位置元字符（\b）

位置元字符（\B）

特殊元字符

空白元字符

元字符	说明
[\b]	回退并删除一个字符
\f	匹配换页符
\n	匹配换行符
\r	匹配回车符
\t	匹配制表符
\v	匹配垂直制表符

数字元字符

元字符	说明
\d	匹配任何一个数字，等价于[0-9]
\D	匹配任何一个非数字字符，等价于[^0-9]

字母数字元字符

元字符	说明
\w	匹配任何一个数字字符或下划线，等价于[a-zA-Z0-9_]
\W	匹配任何一个非数字或非下划线字符，等价于[^a-zA-Z0-9_]

空白字符元字符

元字符	说明
\s	匹配任何一个空白字符，等价于[\f\n\r\t\v]
\S	匹配任何一个非空白字符，等价于[^\f\n\r\t\v]

大小写转换元字符

元字符	说明
\l	把下一个字符转换为小写
\u	把下一个字符转换为大写
\L	把\L到\E之间的字符全部转换为小写
\U	把\U到\E之间的字符全部转换为大写
\E	结束\L或\U转换

子表达式（）

之前的数量元字符只能作用前面的一个字符，如果想作用一长串字符串的话就得使用子表达式。

子表达式是一个更大的表达式的一部分；把一个表达式划分为一系列子表达式的目的是为了把那些子表达式当作一个独立元素来使用。

回溯引用 \1

这个概念光看名字很难理解，看一个例子或许就知道了：

上面的“<H2>This is not valid HTML</H3>”就不是我们所期望的匹配。

这种问题必须使用回溯引用才能解决。

\1是一个回溯引用。它代表着正则表达式里的第一个子表达式，\2代表着第二个子表达式，以此类推。

前后查找

上面的例子可能符合正则表达式的匹配，但是如果我们只想匹配出title里的内容该怎么办呢？

这时候就需要向前或向后查找了。

向前查找 ?=

只匹配:前的内容。

向后查找 ?<=

只匹配$后面的内容。

各种前后查找操作符

操作符	说明
(?=)	向前查找
(?<=)	向后查找
(?!)	负向前查找
(?<!)	负向后查找

负向后查找，只匹配那些不以$开头的数值。

嵌入条件

回溯引用条件

嵌入条件语法使用了?，它的语法格式是“(?(回溯引用)子表达式)”，看一个例子你就会懂得。

“(<[Aa]\s+[^>]+>\s*)?”这里将匹配0个或1个<A>或<a>标签以及<A>或<a>标签的任意属性；

“<[Ii][Mm][Gg]\s+[^>]+>”这里将匹配一个img标签及任意属性；

“(?(1)\s*</[Aa]>)”就是一个回溯引用条件，“?(1)”的作用就是当前面的第一个子表达式匹配成立时，才会执行“\s*</[Aa]>”这个子表达式的匹配。

也就是前面匹配到了<A>标签后面才会匹配</A>标签。

前后条件查找

向前查找存在时，才去匹配“-\d{4}”。

猜你喜欢

转载自www.cnblogs.com/linxian95/p/9983034.html

正则表达式知识整理

JavaScript 正则表达式知识点整理

正则表达式基础知识整理

正则表达式整理

正则表达式整理一

正则表达式方法整理

正则表达式整理格式

常用正则表达式整理

正则表达式的整理

常用的正则表达式整理

正则表达式整理

Python正则表达式整理

十二，正则表达式整理

javascript正则表达式整理

正则表达式由浅入深整理

java 正则表达式整理

PHP 正则表达式整理

正则表达式用法整理

正则表达式的使用整理

正则表达式语法知识

正则表达式相关知识

正则表达式知识(+)

正则表达式的使用知识

正则表达式的简单知识

正则表达式知识详解

正则表达式知识汇总

java正则表达式的知识

正则表达式知识梳理

正则表达式知识概括

正则表达式简单知识

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)