初学python爬虫，记录一下学习过程，正则表达式提取图片网址 - 代码天地

初学python爬虫，记录一下学习过程，正则表达式提取图片网址

其他 2020-03-03 15:55:01 阅读次数: 0

初学python爬虫，今天用正则表达式提取网页内的图片地址

'''
正则表达式模块提取网页图片地址
面向过程式编程
'''
#导入第三方库
import re
import requests
#请求头
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ' \
                        'AppleWebKit/537.36 (KHTML, like Gecko) ' \
                        'Chrome/80.0.3987.100 Safari/537.36'}
#目标网址
url = 'https://www.yeitu.com/meinv/xinggan/'
#请求目标网址
r = requests.get(url,headers = headers)
#请求网页乱码，采用utf-8方式解码
html = r.content.decode('utf-8')
#编译正则表达式对象
passer = re.compile('<li class="image-box">.*?<a.*?<img data-echo="(.*?)".*?</a>',re.S)
#findall方式提取网页所有图片地址
items = re.findall(passer,html)
#遍历打印图片地址
for item in items:
    print(item)

warm...

发布了18 篇原创文章 · 获赞 14 · 访问量 1303

私信关注

猜你喜欢

转载自blog.csdn.net/qq_46292926/article/details/104394279

初学python爬虫，记录一下学习过程，正则表达式提取图片网址

初学python爬虫，记录一下学习过程，正则表达式综合练习，提取电影名称和图片网址

初学python爬虫，记录一下学习过程，正则表达式提取文本

初学python爬虫，记录一下学习过程，requests xpath 提取图片并保存02

初学python爬虫，记录一下学习过程，requests xpath提取图片地址并保存图片

初学python爬虫，记录一下学习过程，requests xpath os 提取MM图片并保存本地 03

初学python爬虫，记录一下学习过程，xpath提取文本

初学python爬虫，记录一下学习过程，xpath提取属性

初学python爬虫，记录一下学习过程，requests库session处理cookies并登录网址

初学python爬虫，记录一下学习过程，requests库模拟登录01

初学python爬虫，记录一下学习过程，xpath多属性匹配

初学python爬虫，记录一下学习过程，xpath属性多值匹配

初学python爬虫，记录一下学习过程，requests库使用代理

初学python爬虫，记录一下学习过程，requests库获取网页代码

初学python爬虫，记录一下学习过程，requests库模拟登录02，使用 for循环处理cookies

初学python爬虫，记录一下学习过程，requests库处理不信任证书问题

Python网络爬虫与信息提取学习记录（3）——关于Re（正则表达式）库的用法

python爬虫学习笔记(七)-数据提取之正则表达式

记录一下自己写的正则表达式

Linux系统下学习正则表达式的心得

正则表达式了解一下正则表达式了解一下

爬虫学习记录（二）————正则表达式

初学python爬虫，记录一下学习过程，requests库模拟登录03，使用字典推导式处理cookies

asp.net正则表达式提取网址、标题、图片等

Python爬虫学习第一天--利用正则表达式爬取图片

python爬虫学习（八）正则表达式批量爬取妹子图片

python爬虫学习之路(5) 正则表达式

Python爬虫学习笔记（三）——正则表达式

Python 爬虫_正则表达式

Python爬虫（正则表达式）

今日推荐

周排行

django中south支持多数据库

2、实时同步项目

http协议状态码解析

codeup 又一版 A+B(C++)

js三座大山之外的其他知识点

正向代理VS反向代理总结

规范的测试流程（转自51testing）

3、python-连接sql server

转~Jenkins pipeline：pipeline 使用之语法详解

cookie与sessio系列（一）：基本知识入门

每日归档

更多

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)