Python网络爬虫与信息提取（5）—— 实战之爬取网页图片并保存

其他 2020-07-28 14:01:25 阅读次数: 0

前言

上一节用try except框架爬取亚马逊的信息，这一节用爬虫爬取网页图片

完整代码

import requests as req
import os
path = "D:/" # 保存路径
url = "http://bbs.jooyoo.net/attachment/Mon_0905/24_65548_04f46bb3e74aa77.jpg" # 爬取路径
name = url.split("/")[-1] # 获取图片再url中的名字
try:
    if not os.path.exists(path): # 判断路径是否存在
        os.mkdir(path) # 不存在就创建
    if not os.path.exists(path + name): # 判断文件是否已经存在
        r = req.get(url) # 不存在就获取网页响应
        r.raise_for_status() # 抛出异常
        with open(path + name,'wb') as f: # 打开文件
            f.write(r.content) # 写入文件
            print("文件保存成功")
    else:
        print("图片已存在")
except:
    print("爬取失败")

解读with open(path + name,‘wb’) as f
python中文件的读写主要用的函数是open，open的第一个参数是文件路径，第二个是读取的方式，几种读取方式见下图：
在这里插入图片描述
那么如果你只用open的话，如果这个路径不存在是会报异常的，同时你还需要自己调用close函数来关闭这个文件，这样写属实麻烦，所以python提供了用with open的方法打开自动帮你调用close函数。
f.write(r.content) # 写入文件r.content就是文件的二进制格式

参考博客

with open详解

open的方法参数介绍

猜你喜欢

转载自blog.csdn.net/qq_37668436/article/details/105710707

Python网络爬虫与信息提取（5）—— 实战之爬取网页图片并保存

Python网络爬虫与信息提取（9）—— scrapy实战之爬取黑马程序员网页讲师信息

Python网络爬虫与信息提取（4）—— 实战之爬取亚马逊商品信息

python之网络爬虫与信息提取(上篇)

Python网络爬虫与信息提取笔记03-Requests库网络爬虫实战（5个实例）

Python网络爬虫与信息提取(二)：网络爬虫之提取

Python网络爬虫与信息提取（7）—— 用re库爬取淘宝商品信息

Python网络爬虫与信息提取（6）—— 爬取csdn个人博客数据信息

Python网络爬虫与信息提取(第7期) 测验1: Python网络爬虫之规则

Python网络爬虫与信息提取(三)：网络爬虫之实战

2018.5.3（python网络爬虫与信息提取入门）Requests库的爬取性能分析

python网络爬虫与信息提取mooc------爬取实例

Python网络爬虫与信息提取（10）—— 代码搜索全网音乐爬取并下载

Python网络爬虫与信息提取（二）：网络爬虫之规则

网络爬虫之爬取网页图片并保存

Python网络爬虫与信息提取（一）——Requests库的安装、Requests库的get()方法、爬取网页的通用代码框架

Python网络爬虫与信息提取（3）—— 实战之IP地址归属地查询

爬虫：网页信息提取

Python网络爬虫与信息提取之单元一requests库入门代码实战

Python网络爬虫与信息提取（一）requests库的安装与基本方法之get()方法

python网络爬虫和信息提取笔记之BeautifulSoup类

Python网络爬虫与信息提取笔记02-网络爬虫之“盗亦有道”

python爬虫笔记（五）网络爬虫之提取—信息组织与提取方法（2）信息提取的一般方法

python中scrapy的使用之实战爬取网页并保存图片

Python网络爬虫与信息提取（14）—— 百度搜索关键字爬取并整理摘要、标题、关键字等

python中Scrapy实战之爬取网页并保存为json文件

python初级实战系列教程《一、爬虫之爬取网页、图片、音视频》

python爬取网页图片并保存到本地

Python 爬取网页图片并进行本地保存

Python——网络爬虫（爬取网页图片）

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)