模块,re模块

什么是模块

就是你要和某个东西打交道,而这个东西本身和python没有关系。这个东西本身就存在

python提供了一个功能的集合  专门负责和这个东西打交道

实质就是一组功能的集合 

模块的类型

  1.内置模块:不需要自己安装的模块,解释器自带的

  2.第三方模块 : 需要自己安装的模块

  3.自定义模块:我们自己写的模块

re模块

在python中使用正则表达式

正则表达式

  从大段的文字中找到符合规则的内容

    爬虫 从网页的字符串中获取你想要的数据

    日志分析 提取  2019-5-10  10:----  花的所有钱

      什么是日志:  2019-5-10   09:00:00 楼下早点摊  5.00

  判断某个字符串是否完全符合规则

    表单验证:手机号 QQ号  邮箱   银行卡  身份证号  密码

正则表达式  只和字符串打交道

正则表达式的规则 (regex)

规则   字符串    从字符串中找到符合规则的内容

字符组:[]  写在中括号中的内容,都出现在下面的某一个字符的位置上都是符合规则的

[a-z]  匹配所有的小写字母  ascii码(97-122)

[0-9]  匹配所有的数字

[A-Z]  匹配所有的大写字母  ascii码(65-90)

[a-zA-Z] 匹配大小写字母

[a-zA-Z0-9] 匹配大小写字母,数字

[a-zA-Z0-9_] 匹配大小写字母,数字,下划线

转义符 \w,转义w,让w具有了特殊的意义,在正则表达式中代表 匹配数字字母下滑线

   \\w  前面的第一个转义符转义了第二个转义符,让第二个转义符失去了转义的特殊功能

    恢复成一个普通的\,这样只能匹配上一个普通的\w了

元字符 

\w  匹配数字字母下划线 word

\d 匹配数字 digit

\s 匹配所有的空白符  回车/换行符  制表符  空格  space

  匹配换行符   回车 \n

  匹配制表符   tab   \t

  匹配空格   

\W \D \S 和 \w \d \s 取反

  [\s\S],[\d\D],[\w\W]是三组全集,匹配所有字符

\b 表示单词的边界

^ 表示匹配一个字符串的开始

$ 表示匹配一个字符串的结束

. 表示匹配 出换行符之外的所有字符

[] 只要出现在中括号内的内容都可以被匹配

[^] 只要不出现在中括号中的内容都可以被匹配

  

猜你喜欢

转载自www.cnblogs.com/Little-Raccoon/p/10845445.html