1、正则表达式

1、基础知识

  什么是正则表达式?

    一种匹配字符串的规则

  应用领域

    自动化开发、数据分析  爬虫  注册页面的表单验证、web开发

2、正则表达式的语法

  元字符

    字符组[ ]  [^] 除了  | 或  () 分组

    在一个字符位置上能出现的内容

    [0-9][a-z][A-Z]  匹配三个字符

    [abc0-9]  匹配一个字符

    [0-9a-zA-Z]  匹配一个字符

    \d  表示匹配的一个字符,匹配数字

    \w  表示匹配数字字母下划线

    \s  表示匹配 空格、换行符、制表符

    \D  表示匹配非数字的字符

    \W  表示匹配非数字字母下划线

    \S  表示匹配非空白(制表符、换行符、空格)

    [\d\D]  [\w\W]  [\s\S]  匹配所有

  量词

    ?  表示重复0次或1次

    +  表示重复1次或多次

    *  表示重复0次或多次

    {n}  {n,}  {n,m}

    \d+(\.\d+)?  小数或整数

    特殊的用法和现象

      1、在量词的后面跟了一个 ?表示取消贪婪匹配    非贪婪(惰性)模式   回溯算法

        ??\+?  \*? \{n}?

        {1,3}?取消贪婪模式

        .*?x  最常用 匹配任意字符直到找到x

        李.{1,3}?和     李连英和

帮助学习的工具 http://tool.chinaz.com/regex/

猜你喜欢

转载自www.cnblogs.com/wjs521/p/9432759.html