用python3从网页中爬取图片下载到本地 - 代码天地

用python3从网页中爬取图片下载到本地

其他 2018-11-11 09:51:21 阅读次数: 0

#####前提：使用的python是python3版本，2和3还是有很大的区别的。
1、先找一个有图片的网页（这里找到的是新浪：http://photo.sina.com.cn）。右键，选择最后一个检查，就可以看到网页的源代码。然后是图片的都是在标签（）中。
urllib.request是爬取网页时需要用到的一个库,re是正则匹配的一个库。
具体可以参考一下这篇文章：
https://blog.csdn.net/duxu24/article/details/77414298

import urllib.request,re

f=urllib.request.urlopen("http://photo.sina.com.cn")
source = f.read()
source = source.decode('utf-8')
#先将截取的目标代码取下来
print(re.search(r'(<img src=\")(.*)(\")',source))

在这里插入图片描述
可以看到是这样的输出，但是我们的目的是只选取蓝色的部分
改进

import urllib.request,re

f=urllib.request.urlopen("http://photo.sina.com.cn")
source = f.read()
source = source.decode('utf-8')
# print(source)
res = re.search(r'(<img src=\")(.*)(\")',source)
#加入这一部分
print(res.groups()[1])

但是输出结果是这样，说明上面分组的时候最后一个”被当成了最后面的”，所以加个alt即可

http://n.sinaimg.cn/news/transform/700/w1000h500/20180921/ebN_-hiixpup3269628.jpg" alt="2018年喜剧野生动物摄影大赛入围作品" usemap="#Map01

最终

import urllib.request,re

url=urllib.request.urlopen("http://photo.sina.com.cn")
source = url.read()
#将中文字符解码成utf-8的形式
source = source.decode('utf-8')

res = re.search(r'(<img src=\")(.*)(\" alt)',source)
link=res.groups()[1]

link_jpg=urllib.request.urlopen(link)
f=open("test.jpg",'wb')
f.write(link_jpg.read())
f.close()

爬取的图片
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/myydebk666/article/details/82803541

用python3从网页中爬取图片下载到本地

爬取简单网页图片下载到本地

JAVA Jsoup爬取网页图片下载到本地

shell 爬取图片下载到本地

scrapy框架来爬取壁纸网站并将图片下载到本地文件中

Python 爬虫网页图片下载到本地

python3.x简单爬虫（爬取百度壁纸图片下载本地）

python 爬取指定图片并将图片下载到指定文件夹

Python学习爬取图片并下载到本地（5）

python3爬取网页图片

Python爬虫之selenium爬取英雄联盟官网英雄全皮肤图片下载到本地和保存到MongoDB数据库

Python脚本1:批量获取图片下载到本地

nodejs爬取网页所有有效图片资源，并下载到本地文件夹中

PHP图片下载到本地示例

python3爬虫爬取网页图片简单示例

python3爬虫之二：爬取网页图片

python3 从网页上爬取图片

python3爬取网页图片路径并写入文件

Python3 使用request模块爬取网页的图片

vue 图片下载到本地，图片保存到本地

Python爬虫实战：基于Scrapy爬取虎牙星秀主播图片并下载到本地

Python爬虫实战：根据关键字爬取某度图片批量下载到本地

用python爬取qq好友的头像并都下载到本地

python3爬取网页中的邮箱地址

python爬虫五：爬取小说，下载到本地

Python3爬取人人网（校内网）个人照片及朋友照片，并一键下载到本地~~~附源代码

python3 爬取天气网页

Python爬百度图片并下载到本地实战

javascript，vue实现图片下载到本地

HTML+JS 实现图片下载到本地

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)