正则
一、概念
正则:就是对字符串操作的一种逻辑公式。其实就是用提前事先定义好的一些特殊的代表字符来组成规律性的字符串, 来对字符串进行一些查找替换的操作。
二、创建正则
- 字面量创建方式: var reg = /规则字符串/修饰符;
var reg = /web/ig;
console.log(reg);///web/gi
- 构造函数创建方式: var reg = new RegExp(‘规则字符串’, ‘修饰符’);
var reg1 = new RegExp('web', 'ig');
console.log(reg1);///web/gi
三、 修饰符
-
i: ignore case 忽略大小写情况
-
g: global 全局匹配
var str = 'web123WEB456web789web000';
var reg = /web/gi;
var s = str.replace(reg, 'python');
console.log(s);//python123python456python789python000
四、字符串方法
- 替换:字符串.replace(正则, 新字符); 返回新字符串, 原字符串不改变
var str = 'web123WEB456web789web000';
var reg = /web/gi;
var s = str.replace(reg, 'python');
console.log(s);//python123python456python789python000
- 分隔:字符串.split(正则); 返回新数组
var str = 'web123Web456web789web000';
var reg = /web/gi;
var arr = str.split(reg);
console.log(arr)//(5) ["", "123", "456", "789", "000"]
- 挑选:字符串.match(正则); 挑选符合条件的字符,组成新的数组后返回回来
var str = 'web123Web456web789web000';
var reg = /\d/ig; // 匹配数字
var arr2 = str.match(reg);
console.log(arr2);//(12) ["1", "2", "3", "4", "5", "6", "7", "8", "9", "0", "0", "0"]
- 查找:字符串.search(正则); 从下标为0的位置开始匹配,匹配到符合正则的字符后就返回下标
var str = 'web123Web456web789web000';
var reg = /\d/ig; // 匹配数字
console.log(str.search(reg));//3
五、检索方法(exec、test)
-
exec: 正则.exec(要匹配的字符串); 每次会返回符合条件的字符组成的数组
-
test: 正则.test(要匹配符的字符串); 返回是否匹配成功, 匹配成功返回true, 失败返回false
*如果不加修饰符g,每次都是从0开始查找或者匹配, 如果加了g, 表示从上一次匹配到的位置的下一位开始匹配, 匹配结果返回null或者false之后,下一次匹配从0 开始重新匹配
*reg.lastIndex 获取到当前开始匹配正则的位置
var str = 'web123web456';
var reg = /\d\d\d/g;
console.log(reg.lastIndex); // 0
console.log(reg.exec(str)); // ["1", index: 3, input: "web123web456", groups: undefined]
console.log(reg.lastIndex); // 4
console.log(reg.exec(str)); // 2
console.log(reg.lastIndex); // 5
console.log(reg.exec(str)); // 3
console.log(reg.lastIndex); // 0
console.log(reg.test(str)); // true
console.log(reg.lastIndex); // 6
console.log(reg.test(str)); // true
console.log(reg.lastIndex); // 12
console.log(reg.test(str)); // false
console.log(reg.lastIndex); // 0
console.log(reg.test(str)); // true
六、 元字符
- 点. : 匹配除换行以外的所有字符
var str = '\n 123';
var reg = /./;
console.log(reg.exec(str));//[" ", index: 1, input: "↵ 123", groups: undefined]
- []: 字符集, 要匹配的字符的字符集合, 在字符集中不需要加,分隔,也不需要加引号 [^]: 字符集, 不要匹配的字符的字符集合
var str = 'web123web456';
var reg = /[413]/ig;
console.log(reg.exec(str)); // 1
console.log(reg.exec(str)); // 3
- \d: 匹配数字 在字符集中 0-9==\d \D:匹配非数字
var str = 'web123';
var reg = /\d\d\d/ig;
console.log(reg.exec(str)); // 123
var reg = /\D/ig;
console.log(reg.exec(str)); // w
// 银行卡密码 6位数字
var reg = /\d\d\d\d\d\d/;
var str = 'a12345';
console.log(reg.test(str));//false
- \s: 匹配空格 \S: 匹配非空格
var str = 'web 123';
var reg = /\s/ig;
console.log(reg.exec(str)); // 3
var reg = /\S/ig;
console.log(reg.exec(str)); // 0
- \w: 匹配数字、字母、_ \W: 匹配非数字、字母、_
var str = '_w1.23*';
var reg = /\w/ig;
console.log(reg.exec(str)); // _
var reg = /\W/ig;
console.log(reg.exec(str)); // .
- \b: 匹配单词边界 \B: 匹配非单词边界
var str = 'you are a beautiful boy';
var reg = /\ba/ig; // 匹配a左边是边界的a
console.log(reg.exec(str)); // 4
var reg = /a\B/ig; // 匹配a右边不是单词边界
console.log(reg.exec(str)); // 4
- ^: 以什么为开头 $: 以什么为结尾
var str = '912345';
var reg = /^\d\d\d\d\d\d$/;
console.log(reg.test(str)); //true
console.log(reg.exec(str)); //["912345", index: 0, input: "912345", groups: undefined]
七、多个字符
- a?: 表示一个或0个
var str = '1web123';
var reg = /\d?/ig;
console.log(reg.exec(str));//["1", index: 0, input: "1web123", groups: undefined]
- a*: 表示匹配0个或者连续的多个字符,尽可能多的去匹配
var str = '123456web33333';
var reg = /\d*/;
console.log(reg.exec(str));//["123456", index: 0, input: "123456web33333", groups: undefined]
- a+: 表示匹配至少一个以上的连续的字符,尽可能多的去匹配
var str = 'webweb3444';
var reg = /\d+/;
console.log(reg.exec(str));//["3444", index: 6, input: "webweb3444", groups: undefined]
- a{n,m}: 表示至少匹配n次,最多匹配m次
- a{n}: 表示只匹配n次
var str = 'web1234567890';
var reg = /\d{3}/;
console.log(reg.exec(str)); // 123
- a{n,}: 至少匹配n次
var str = 'web1234567890';
var reg = /\d{3,}/;
console.log(reg.exec(str)); // 1234567890
- a{n,m}: 表示至少匹配n次,最多匹配m次
var str = 'web1234567890';
var reg = /^web\d{3,6}/;
console.log(reg.exec(str)); // web123456
八、其它字符
-
|: 或
-
(): 分组 获取分组的匹配值: RegExp.$1 RegExp.$2
var str = 'web1zweb2web3';
var reg = /web(1|5)(w|z)/;
console.log(reg.exec(str)); // ["web1z", "1", "z", index: 0, input: "web1zweb2web3", groups: undefined]
console.log(RegExp.$1);//1
console.log(RegExp.$2);//z
- (?:): 非获取匹配
var str = 'web1zweb2web3';
var reg = /web(?:5|2)/; // web后面是5或者是2的web
console.log(reg.exec(str));//["web2", index: 5, input: "web1zweb2web3", groups: undefined]
- (?=): 正向肯定预查
var str = 'web123webdffff';
var reg = /web(?=\d+)/; // web后面必须跟数字
console.log(reg.exec(str));//["web", index: 0, input: "web123webdffff", groups: undefined]
- (?!): 正向否定预查
var reg = /web(?!\d+)/; // web后面不跟数字的
console.log(reg.exec(str));//["web", index: 6, input: "web123webdffff", groups: undefined]
- (?<=): 反向肯定预查
var reg = /(?<=\d+)web/; // web的前面是跟数字的web
console.log(reg.exec(str)); // 6
- (?<!): 反向否定预查
var reg = /(?<!\d+)web/;
console.log(reg.exec(str)); // 0
// 不能全是数字的组合
var str = '124456';
var reg = /(?!^\d+$)^[0-9a-zA-Z]+$/;
console.log(reg.test(str)); // false
// 必须是数字和字母的组合 不能全是数字、不能全是字母
var reg = /(?!^\d+$)(?!^[a-zA-Z]+$)^[0-9a-zA-Z]+$/;
var str = '1223a3344';
console.log(reg.test(str)); // false
常用正则
一、校验数字的表达式
-
数字:^[0-9]*$
-
n位的数字:^\d{n}$
-
至少n位的数字:^\d{n,}$
-
m-n位的数字:^\d{m,n}$
-
零和非零开头的数字:^(0|[1-9][0-9]*)$
-
非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
-
带1-2位小数的正数或负数:^(-)?\d+(.\d{1,2})?$
-
正数、负数、和小数:^(-|+)?\d+(.\d+)?$
-
有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
-
有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
-
非零的正整数:^[1-9]\d*$ 或 ^([1-9][0-9]){1,3}$ 或 ^+?[1-9][0-9]$
-
非零的负整数:^-[1-9][]0-9"$ 或 ^-[1-9]\d$
-
非负整数:^\d+$ 或 ^[1-9]\d*|0$
-
非正整数:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
-
非负浮点数:^\d+(.\d+)?$ 或 ^[1-9]\d*.\d*|0.\d*[1-9]\d*|0?.0+|0$
-
非正浮点数:^((-\d+(.\d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]\d*.\d*|0.\d*[1-9]\d*))|0?.0+|0$
-
正浮点数:^[1-9]\d*.\d*|0.\d*[1-9]\d*$ 或 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$
-
负浮点数:^-([1-9]\d*.\d*|0.\d*[1-9]\d*)$ 或 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
-
浮点数:^(-?\d+)(.\d+)?$ 或 ^-?([1-9]\d*.\d*|0.\d*[1-9]\d*|0?.0+|0)$
二、校验字符的表达式
-
汉字:^[\u4e00-\u9fa5]{0,}$
-
英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
-
长度为3-20的所有字符:^.{3,20}$
-
由26个英文字母组成的字符串:^[A-Za-z]+$
-
由26个大写英文字母组成的字符串:^[A-Z]+$
-
由26个小写英文字母组成的字符串:^[a-z]+$
-
由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$
-
由数字、26个英文字母或者下划线组成的字符串:^\w+$ 或 ^\w{3,20}$
-
中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
-
中文、英文、数字但不包括下划线等符号:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
-
可以输入含有^%&’,;=?KaTeX parse error: Can't use function '\"' in math mode at position 1: \̲"̲等字符:[^%&',;=?\x22]+ 12 禁止输入含有~的字符:[^~\x22]+
三、特殊需求表达式
-
Email地址:^\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*$
-
域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
-
InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+.)+[\w-]+(/[\w-./?%&=]*)?$
-
手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
-
电话号码(“XXX-XXXXXXX”、“XXXX-XXXXXXXX”、“XXX-XXXXXXX”、“XXX-XXXXXXXX”、"XXXXXXX"和"XXXXXXXX):^((\d{3,4}-)|\d{3.4}-)?\d{7,8}$
-
国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
-
身份证号(15位、18位数字):^\d{15}|\d{18}$
-
短身份证号码(数字、字母x结尾):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
-
帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
-
密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
-
强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.\d)(?=.[a-z])(?=.*[A-Z]).{8,10}$
-
日期格式:^\d{4}-\d{1,2}-\d{1,2}
-
一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
-
一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
-
钱的输入格式:
-
1.有四种钱的表示形式我们可以接受:“10000.00” 和 “10,000.00”, 和没有 “分” 的 “10000” 和 “10,000”:^[1-9][0-9]*$
-
2.这表示任意一个不以0开头的数字,但是,这也意味着一个字符"0"不通过,所以我们采用下面的形式:^(0|[1-9][0-9]*)$
-
3.一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号:^(0|-?[1-9][0-9]*)$
-
4.这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能是负的吧.下面我们要加的是说明可能的小数部分:^[0-9]+(.[0-9]+)?$
-
5.必须说明的是,小数点后面至少应该有1位数,所以"10."是不通过的,但是 “10” 和 “10.2” 是通过的:^[0-9]+(.[0-9]{2})?$
-
6.这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样:^[0-9]+(.[0-9]{1,2})?$
-
7.这样就允许用户只写一位小数.下面我们该考虑数字中的逗号了,我们可以这样:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
-
8.1到3个数字,后面跟着任意个 逗号+3个数字,逗号成为可选,而不是必须:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
-
备注:这就是最终结果了,别忘了"+“可以用”*"替代如果你觉得空字符串也可以接受的话(奇怪,为什么?)最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里
-
xml文件:^([a-zA-Z]±?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]$
-
中文字符的正则表达式:[\u4e00-\u9fa5]
-
双字节字符:[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))
-
空白行的正则表达式:\n\s*\r (可以用来删除空白行)
-
HTML标记的正则表达式:<(\S*?)[^>]>.?</\1>|<.*? /> (网上流传的版本太糟糕,上面这个也仅仅能部分,对于复杂的嵌套标记依旧无能为力)
-
首尾空白字符的正则表达式:^\s*|\s*KaTeX parse error: Undefined control sequence: \s at position 4: 或(^\̲s̲*)|(\s*) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)
-
腾讯QQ号:[1-9][0-9]{4,} (腾讯QQ号从10000开始)
-
中国邮政编码:[1-9]\d{5}(?!\d) (中国邮政编码为6位数字)
-
IP地址:\d+.\d+.\d+.\d+ (提取IP地址时有用)
-
IP地址:((? : (?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d))