什么是模块
就是你要和某个东西打交道,而这个东西本身和python没有关系。这个东西本身就存在
python提供了一个功能的集合 专门负责和这个东西打交道
实质就是一组功能的集合
模块的类型
1.内置模块:不需要自己安装的模块,解释器自带的
2.第三方模块 : 需要自己安装的模块
3.自定义模块:我们自己写的模块
re模块
在python中使用正则表达式
正则表达式
从大段的文字中找到符合规则的内容
爬虫 从网页的字符串中获取你想要的数据
日志分析 提取 2019-5-10 10:---- 花的所有钱
什么是日志: 2019-5-10 09:00:00 楼下早点摊 5.00
判断某个字符串是否完全符合规则
表单验证:手机号 QQ号 邮箱 银行卡 身份证号 密码
正则表达式 只和字符串打交道
正则表达式的规则 (regex)
规则 字符串 从字符串中找到符合规则的内容
字符组:[] 写在中括号中的内容,都出现在下面的某一个字符的位置上都是符合规则的
[a-z] 匹配所有的小写字母 ascii码(97-122)
[0-9] 匹配所有的数字
[A-Z] 匹配所有的大写字母 ascii码(65-90)
[a-zA-Z] 匹配大小写字母
[a-zA-Z0-9] 匹配大小写字母,数字
[a-zA-Z0-9_] 匹配大小写字母,数字,下划线
转义符 \w,转义w,让w具有了特殊的意义,在正则表达式中代表 匹配数字字母下滑线
\\w 前面的第一个转义符转义了第二个转义符,让第二个转义符失去了转义的特殊功能
恢复成一个普通的\,这样只能匹配上一个普通的\w了
元字符
\w 匹配数字字母下划线 word
\d 匹配数字 digit
\s 匹配所有的空白符 回车/换行符 制表符 空格 space
匹配换行符 回车 \n
匹配制表符 tab \t
匹配空格
\W \D \S 和 \w \d \s 取反
[\s\S],[\d\D],[\w\W]是三组全集,匹配所有字符
\b 表示单词的边界
^ 表示匹配一个字符串的开始
$ 表示匹配一个字符串的结束
. 表示匹配 出换行符之外的所有字符
[] 只要出现在中括号内的内容都可以被匹配
[^] 只要不出现在中括号中的内容都可以被匹配