正则表达式总结(一)
开发工具与关键技术:Visual Studio 、正则表达式
撰写时间: 4月9号
作者: 曾子千
一、正则表达式理解
在我们编写一些处理字符串的代码时,通常被用来检索、替换那些符合某个模式(规则)字符串的需求,而正则表达式就是我们用来操作使用这些代码的工具。简单通俗的讲:正则表达式是用于进行文本匹配的工具!
二、正则表达式看法
例子:jkm,jkstory,jkgh,jk,JK, 要求:在这个字符串中匹配出“jk”
我们可以用正则表达式:jk ,它就会匹配出来字符串,但是在这种情况之下,它匹配出来字符串不仅分大小写字母,不分是否单词(也就是说单词中只要有“jk”都会查找出来)只要是hi就可以匹配。若我们想要精确的只匹配出“jk”这俩个字符串,正则表达式需要在“jk”前后加个斜杠\b,
如:\b jk\b
注:\b:是正则表达式规定的一个特殊代码,我们通常把它叫做元字符,它在单词的开头或结尾,也就是单词的分界处,只匹配一个位置!
当然元字符不单单只有\b,还有以下这些:
三、常用的元字符
代码 说明
(1). 它的意思也就是说除换行符,其它会匹配任意数量的字符串都会匹配出来(不包含换行符)!
(2)\w 它的意思就是匹配数字或字母或汉字,符号只匹配“下划线_”,其它如,。!?等符号则不匹配!
(3)\s 它的意思就是匹配任意的空白符和换行符,其余字符串则不匹配!如果你的代码中有很多空白符,可以用它找出来,用一个进行替换!
(4)\d 它的意思就是只匹配数字,其它任意字符串都不匹配!
(5)\b 它的意思就是匹配单词的开始或结束,就像前面讲描述正则表达式的例子一样!
(6)^ 它的意思就是匹配字符串的开始 而 $ 它的意思就是匹配字符串的结束
注:^ $ 这两个代码在一些验证输入的内容时非常有用