利用scrapy下载图片保存到本地 - 代码天地

利用scrapy下载图片保存到本地

其他 2018-12-01 14:41:18 阅读次数: 0

1.先声明一下，起始位置已经是将所有的图片链接都能到pipelines.py中

2.创建一个类，继承于ImagesPipeline，因此也就需要导入ImagesPipeline

from scrapy.pipelines.images import ImagesPipeline

3.由于继承自ImagesPipeline类，且该类下有一个get_media_requests方法需要被重写

def get_media_requests(self, item, info):

4.由于是通过链接来获取图片，就少不了scrapy.Request(图片链接)这个方法

import scrapy

5.向图片链接发请求后得到的响应会保存到settings.py中的IMAGES_STORE路径中，因此要去配置一下settings.py，

IMAGES_STORE = "/home/zengsf/spider/Douyu/Douyu/Images"

6.别忘了你创建的pipelines.py中的类需要在settings.py中的ITEM_PIPELINES中添加

ITEM_PIPELINES = {
    # 'Douyu.pipelines.DouyuPipeline': 300,
    'Douyu.pipelines.DouyuImagePipline': 200,
}

所有代码：

from scrapy.pipelines.images import ImagesPipeline
import scrapy


class DouyuPipeline(object):
    def process_item(self, item, spider):
        # 可以写存储数据库逻辑
        return item


class DouyuImagePipline(ImagesPipeline):
    # 此方法不能变
    def get_media_requests(self, item, info):
        # 1 获取图片链接
        imageLink = item["imgLink"]
        # 2 向图片链接发请求,响应会保存在settings.py中的IMAGES_STORE路径中
        yield scrapy.Request(imageLink)
        return item

猜你喜欢

转载自www.cnblogs.com/zengsf/p/10049270.html

利用scrapy下载图片保存到本地

下载图片并保存到本地

PHP 下载远程图片保存到本地

PHP高效下载图片保存到本地

vue 图片下载到本地，图片保存到本地

android 利用Retrofit2.0+RxJava2.0实现网络下载图片保存到本地SD卡

scrapy框架爬取图片保存到本地或mongodb的写法

利用Jsoup爬取网站的图片，保存到本地

利用Charles抓取网页中的图片，保存到本地

利用Python下载网络小说并保存到本地文件

php获取远程图片并下载保存到本地

使用URLConnection下载文件或图片并保存到本地

PHP下载远程图片及保存到本地代码

实现从网上下载图片然后保存到本地

PHP远程下载图片保存到本地的方法[demo]

PHP实现下载远程图片保存到本地的方法

C#/.NET 下载图片并保存到本地

C#实现下载远程图片保存到本地

JAVA 通过url下载图片保存到本地

【Python】- scrapy 爬取图片保存到本地、且返回保存路径

vue (本地静态)图片下载到本地，图片保存到本地

利用scrapy获取抽屉新热榜的标题和内容以及新闻地址保存到本地

scrapy爬取校花网男神图片保存到本地

Python：scrapy框架爬取校花网男神图片保存到本地

scrapy爬虫系列之三--爬取图片保存到本地

python爬虫解析图片保存到本地

没有后缀的图片保存到本地

爬取图片并保存到本地

Canvas输出图片并保存到本地

SpringMVC上传文件（图片）并保存到本地

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)