关于爬虫的正则表达式一点记录

其他 2019-11-29 23:18:55 阅读次数: 0

今天再爬虫的正则表达式里纠结了很久，记录下来，防止忘记再浪费时间

 content = requests.get(url)
        
 m=re.findall(r'<a href=\"([0-9a-zA-Z\_\/\.\%\?\=\-\&]+)\"',content.text,re.I)

一开始，我把content变成str(content)放在正则匹配式中，无法匹配，可能是因为str(content)是空的。

所以一定要用content.text来匹配

猜你喜欢

转载自www.cnblogs.com/crayszhangblog/p/11960754.html

关于爬虫的正则表达式一点记录

一点常见的正则表达式

正则表达式一点通

原 Python正则表达式--每日一点属性介绍

Python正则表达式--每日一点 compile filter findall

Python正则表达式--每日一点检索和替换

Python正则表达式--每日一点 match和search

java正则表达式稍微高级一点的用法

爬虫学习记录（二）————正则表达式

学习了一点C#语法知识（string和StringBuilder的区别，正则表达式等）记录一下

【每天进步一点点】正则表达式获取匹配字符串

每天记录一个知识点（常用正则表达式）

关于python正则表达式的一些常见知识点

爬虫之正则表达式

Python 爬虫_正则表达式

Python爬虫（正则表达式）

爬虫：正则表达式

Python爬虫--正则表达式

Python爬虫与正则表达式

网络爬虫的正则表达式

python爬虫正则表达式

python爬虫——正则表达式

【python爬虫】正则表达式

爬虫（六）正则表达式

正则表达式爬虫1

爬虫入门_正则表达式

爬虫（7）——正则表达式

爬虫&正则表达式学习

爬虫常用正则表达式

爬虫系列-正则表达式

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)