正则表达式基本概念

正则表达式:
1、概念:正则表达式就是用于描述字符串规则的工具,即记录文本规则的代码;
***注:可用于各种编程语言中(Servlet注解也支持正则表达式)
2、常见的正则表达式:
(1)^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$               Email格式
(2)^[a-zA-Z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\s*)?$             URL地址
(3)[a-zA-Z0-9_\-]               常用合法文本
(4)^\d+$                        非负整数
(5)[\u4e00-\u9fa5]                中文字符
(6)<(.*)>.*<\/\1>|<(.*)/>             HTML标记
(7)(\d{3}-|\d{4}-)?(\d{8}|\d{7})          国内电话
3、元字符是构成正则表达式最基本的部分,主要元素符如下:
(1).           匹配出换行符以外的任意字符;
(2)\w         匹配字母或数字或下划线
(3)\s          匹配任意的空白符
(4)\d         匹配数字
(5)\b         匹配单词的开始或结束
(6)^          匹配字符串的开始
(7)$          匹配字符串的结束
4、重复:正则表达式验证字符出现的次数
(1)*            重复零次或更多次(*零多)
(2)+          重复一次或更多次(+一多)
(3)?         重复零次或一次(?零一)
(4){n}       重复n次
(5){n,}   重复n次或更多次
(6){n,m}重gun次到m次
5、范围:[]可以实现匹配某一个范围中的一个字符(只要有一个就匹配)
[]还可以指定匹配一个区间
6、分支:(即为或|)指有几种规则,如果满足其中任何一种规则都是匹配的,只需要将不同的规则分开罗列;
7、反义:常用的反义限定符如下:
(1)\W      匹配任意不是字母、数字、下划线的字符;
(2)\S       匹配任意不是空白符的字符;
(3)\D      匹配任意非数字的字符;
(4)\B      匹配不是单词开头或结束
(5)[^x]   匹配除了x以外的任意字符
(6)[^0~3]    匹配除了0~3以外的任意字符
8、转义:当正则表达式中出现元字符时,需要使用转义字符\进行转义(在[]中是元字符可以不用转,加\转义也不会起作用)
*9、在Java中使用正则表达式
String    reg = “定义的正则表达式”;
String    str = “要进行匹配的字符”;
Pattern  pattern = Pattern.compile(reg);
Matcher  matcher = Pattern.matcher(str);
System.out.println(matcher.matches());
发布了15 篇原创文章 · 获赞 0 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/deciduous_leaves/article/details/78369057