正则表达式(单个字符部分)

(作者:杨东升,撰写时间:2019.5.1)
正则表达式英文名为:Regular Expression, 通常简写为regex、regexp或RE, 是计算机的一个概念。正则表达式通常被用来检索、替换那些符合某些规则的文本。就是定义一些字符的“规则字符串,用来对字符串的过滤。
C#中正则表达使用的类为:
在这里插入图片描述
使用的方法:
在这里插入图片描述

正则表达式:

匹配纯文本,纯文本看起来可能不像是个正则表达式,但它的确是。正则表达式是可以包括纯文本的。但如果只用纯文本是没什么意义的,但把它作为学习正则表达式的起点还是不错的。
在这里插入图片描述

正则字符: . ; 匹配除了换行符的任意字符
正则字符: \s ; 匹配空白符,等价于[\f\n\r\t\v]
正则字符: \b ; 匹配单词的开始或结束
正则字符: \d ; 匹配数字,等价于[0-9]
正则字符: \w ; 匹配字母、数字、下划线,等价于[A-Za-z0-9_]

正则字符: \S ; 匹配不是空白符的字符[^\f\n\r\t\v]
正则字符: \B ; 匹配不是单词的开始或结束的位置
正则字符: \D ; 匹配不是数字的字符,等价于[^0-9]
正则字符: \W ; 匹配不是字母、数字、下划线的字符,等价于[^A-Za-z0-9_]

正则字符: x|y ; 匹配x或y
正则字符: [xyz]; 字符集合,匹配所包含的任意一个字符
正则字符: [a-z] ; 字符范围,匹配指定范围内的任意字符(小写a到小写z)

正则字符: [^xyz] ;匹配除了xyz任意的字符
正则字符: [^a-z] ;匹配小写字母以外的任意字符

正则字符: ^ ; 单独使用表示匹配字符串的开始
正则字符: $ ; 匹配字符串的结束
(一般组合使用^$,用来限制一串字符开始和结尾的位置)

正则字符: * ; 重复零次或更多次,等价于{0,}
正则字符: + ; 重复一次或更多次,等价于{1,}

正则字符: ? ; 重复零次或一次,等价于{0,1}
在这里插入图片描述

正则字符: {n} ; 重复n次
正则字符: {n,} ; 重复n次或更多次
正则字符: {n,m} ; 重复n到m次

正则字符: *? ; 重复任意次,但尽可能少重复
正则字符: +? ; 重复一次或更多次,但尽可能少重复
正则字符: ?? ; 重复0次或1次,但尽可能少重复
正则字符: {n,} ?; 重复n次以上,但尽可能少重复
正则表达式默认是贪婪型的,它会匹配尽可能多的字符,但更多时候我们需要懒惰的匹配,也就是匹配尽可能少的字符。
比如说,这是就是它默认的贪婪型
在这里插入图片描述
只要在它后面加上一个?号,就可以让它懒惰的匹配:
在这里插入图片描述

字符转义:
当你想查找代码本身的话(比如你查找 . ,或者 * ),问题就来了,因为他们会被解释成上面说的意思,因此,你应该使用.和* 。当然,要查找 \ 本身,用 \ 就行了。
比如:
正则表达式:www.baidu.com 可以匹配到 www.baidu.com
正则表达式:C:\windows 可以匹配到 C:\windows

猜你喜欢

转载自blog.csdn.net/weixin_44544859/article/details/89923789