正则表达式基本概念

正则表达式：
1、概念：正则表达式就是用于描述字符串规则的工具，即记录文本规则的代码；
***注：可用于各种编程语言中（Servlet注解也支持正则表达式）
2、常见的正则表达式：
（1）^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$               Email格式
（2）^[a-zA-Z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\s*)?$             URL地址
（3）[a-zA-Z0-9_\-]               常用合法文本
（4）^\d+$                        非负整数
（5）[\u4e00-\u9fa5]                中文字符
（6）<(.*)>.*<\/\1>|<(.*)/>             HTML标记
（7）(\d{3}-|\d{4}-)?(\d{8}|\d{7})          国内电话
3、元字符是构成正则表达式最基本的部分，主要元素符如下：
（1）.           匹配出换行符以外的任意字符；
（2）\w         匹配字母或数字或下划线
（3）\s          匹配任意的空白符
（4）\d         匹配数字
（5）\b         匹配单词的开始或结束
（6）^          匹配字符串的开始
（7）$          匹配字符串的结束
4、重复：正则表达式验证字符出现的次数
（1）*            重复零次或更多次（*零多）
（2）+          重复一次或更多次（+一多）
（3）？         重复零次或一次（？零一）
（4）{n}       重复n次
（5）{n，}   重复n次或更多次
（6）{n，m}重gun次到m次
5、范围：[]可以实现匹配某一个范围中的一个字符（只要有一个就匹配）
[]还可以指定匹配一个区间
6、分支：（即为或|）指有几种规则，如果满足其中任何一种规则都是匹配的，只需要将不同的规则分开罗列；
7、反义：常用的反义限定符如下：
（1）\W      匹配任意不是字母、数字、下划线的字符；
（2）\S       匹配任意不是空白符的字符；
（3）\D      匹配任意非数字的字符；
（4）\B      匹配不是单词开头或结束
（5）[^x]   匹配除了x以外的任意字符
（6）[^0~3]    匹配除了0~3以外的任意字符
8、转义：当正则表达式中出现元字符时，需要使用转义字符\进行转义（在[]中是元字符可以不用转，加\转义也不会起作用）
*9、在Java中使用正则表达式
String    reg = “定义的正则表达式”；
String    str = “要进行匹配的字符”；
Pattern  pattern = Pattern.compile(reg);
Matcher  matcher = Pattern.matcher(str);
System.out.println(matcher.matches());

deciduous_leaves

发布了15 篇原创文章 · 获赞 0 · 访问量 1万+

私信关注

正则表达式基本概念

猜你喜欢