C#正则表达式简单总结

C#:
c#中验证正则表达式的类为System.Text.RegularExpressions.Regex
简单的匹配方法为IsMatch(4个重载方法)


正则表达式语法:
一、匹配单个字符
[ ]:从中选择一个字符匹配
如:单词字符([ae])、非单词字符([!?,;@#$*])、字母范围([A-Z])、数字范围([0-9])、^在[ ]中为排除某些字符(如[^a]匹配除a以外的任何字符)
eg.正则表达式[ae]ffect
可匹配字符串 affect,effect

注意:要在字符类中匹配连字符,那么把连字符号作为第一个字符列出即可。


二、特殊匹配字符
\t:匹配制表符 \r:匹配硬回车符 \n:匹配换行符
.:匹配任何除了\n以外的字符(\.则匹配该字符本身)
\w:匹配任何单词字符(任何字母或数字)
\W:匹配任何非单词字符(除了字母和数字以外的任何字符)
\s:匹配任何空白字符(包括空格、换行、制表符等) 
\S:匹配任何非空白字符(除了空格、换行、制表符等的任何字符)
\d:匹配任何数字字符(0~9的数字) 
\D:匹配任何非数字字符(除了0~9以外的任何字符)
^:匹配字符串的开头(或者多行模式下行的开头)。 
$:匹配字符串的结尾,或者是字符串结尾“\n”之前的最后一个字符,或者是多行模式中的行结尾。 
\A:匹配字符串的开头(忽略多行模式) \Z:匹配字符串的结尾或字符串结尾“\n”之前的最后一个字符(忽略多行模式)。 

\z:匹配字符串的结尾。 \G:匹配当前搜索开始的位置。 

\b:匹配单词的边界。 \B:匹配单词的非边界。 

注意:

1、\A和\z在确保字符串所包含的是某个表达式,而不是其他内容时很用。

eg.正则表达式\Asophia\z

可匹配字符串要 sophia(不含任何额外的字符、换行符或者空白。)

2、可以使用\b匹配单词的边界
eg.正则表达式\blet\b
可匹配字符串 let
不可匹配字符串letter,hamlet


三、匹配二选一

|:匹配二选一

eg.正则表达式col(o|ou)r
可匹配字符串 color,colour

注意:\b(bill|ted)和\bbill|ted是不同的。

后者可以匹配malted


四、量词匹配

*:匹配0次或多次 +:匹配1次或多次 ?:匹配0次或1次{n}:恰好匹配n次

{n,}:至少匹配n次{n,m}:至少匹配n次,至多匹配m次

eg.正则表达式brothers?
可匹配字符串 brother,brothers

eg.正则表达式\bp\d{3,5}
可匹配字符串 \b以p开头,且后跟3~5个数字结尾

注意:也可以把量词与()一起使用,以便把该量词应用到整个字母序列。
eg.正则表达式(The)?schoolisbeautiful.
可匹配字符串 schoolisbeautiful,Theschoolisbeautiful.


五、贪婪量词

识别正则表达式和贪婪 有些量词是贪婪的(greedy).他们会尽可能多的匹配字符。
如量词*匹配0个或多个字符。假设要匹配字符串中任何HTML标签。你可能会用如下正则表达式:
<.*>
现有字符串A<i>quantifier</i>canbe<big>greedy</big>
结果<.*>把<i>quantifier</i>canbe<big>greedy</big>都匹配上了。
要解决该问题,需要与量词一起使用一个特殊的非贪婪字符“?”,因此表达式变化如下:
<.*?>
这样就可以正确匹配<i>、</i>、<big>、</big>。


六、捕获和反向引用

():用来捕获其中的字符串
\数字:用编号来引用
eg.
正则表达式 (\w)(\w)\2\1
可匹配字符串abba(回文)
注意:
1、反向引用用来匹配html标签非常有效如<(\w+)></\1>可以匹配<table></table>等类似格式的标签。


常用的C#正则表达式:

"^\d+$" //非负整数(正整数 + 0) 
"^[0-9]*[1-9][0-9]*$" //正整数 
"^((-\d+)|(0+))$" //非正整数(负整数 + 0) 
"^-[0-9]*[1-9][0-9]*$" //负整数 
"^-?\d+$" //整数 
"^\d+(\.\d+)?$" //非负浮点数(正浮点数 + 0) 
"^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$" //正浮点数 
"^((-\d+(\.\d+)?)|(0+(\.0+)?))$" //非正浮点数(负浮点数 + 0) 
"^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$" //负浮点数 
"^(-?\d+)(\.\d+)?$" //浮点数 
"^[A-Za-z]+$" //由26个英文字母组成的字符串 
"^[A-Z]+$" //由26个英文字母的大写组成的字符串 
"^[a-z]+$" //由26个英文字母的小写组成的字符串 
"^[A-Za-z0-9]+$" //由数字和26个英文字母组成的字符串 
"^\w+$" //由数字、26个英文字母或者下划线组成的字符串 
"^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$" //email地址 
"^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$" //url 
/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/ // 年-月-日 
/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/ // 月/日/年 
"^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$" //Emil 
"(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?" //电话号码 
"^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$" //IP地址 

猜你喜欢

转载自blog.csdn.net/u013212391/article/details/38066981
今日推荐