Scrapy 在shell下抓取图片

其他 2018-12-15 13:23:48 阅读次数: 0

版权声明：版权声明 https://blog.csdn.net/duty_is_codeing/article/details/72978490

scrappy 新手的练习工具scrapy shell

开发环境macbook 终端zsh模式
已安装有scrapy项目
实例练习抓取http://www.5857.com/meixiong/ 网址里面的图片
在zsh终端输入
scrapy shell http://www.5857.com/meixiong/
进入一个Scrapy交互终端
关于Scrapy shell 的官网文档
http://scrapy-chs.readthedocs.io/zh_CN/0.24/topics/shell.html

首先倒入需要实用的包

>>> from scrapy.selector import Selector
>>> from scrapy.http import HtmlResponse
>>> import urllib
>>> import os
>>> img_urls=response.css('img').xpath('@src').extract()
*//实用xpath 和css 两种过滤方式获取图片路径*
>>> img_urls[3]
u'http://www.5857.com/uploadfile/2017/0608/20170608022711475.jpg'
*//实用urllib retrieve方法下载图片*
>>> urllib.urlretrieve(img_urls[3],"/Users/macuser/Pictures/11475.jpg")
('/Users/macuser/Pictures/11475.jpg', <httplib.HTTPMessage instance at 0x103f89998>)
//实用split方法截取到url末端的图片名
>>> temptexts=img_urls[3].split('/')
>>> file_name=temptexts[len(temptexts)-1]
>>> file_name
u'20170608022711475.jpg'
*//使用file_name 下载图片*
>>> urllib.urlretrieve(img_urls[3],"/Users/macuser/Pictures/"+file_name)
(u'/Users/macuser/Pictures/20170608022711475.jpg', <httplib.HTTPMessage instance at 0x103f83200>)
*／／使用for循环下img_urls里面所有的图片*
>>> for i in range(len(img_urls)):
...  temptexts=img_urls[i].split('/')
...  file_name=temptexts[len(temptexts)-1]
...  urllib.urlretrieve(img_urls[i],"/Users/macuser/Pictures/"+file_name)

实现下载img到用户图片目录

学习的一小步

猜你喜欢

转载自blog.csdn.net/duty_is_codeing/article/details/72978490

Scrapy 在shell下抓取图片

笔记——scrapy 抓取图片

scrapy初探（抓取图片）

scrapy抓取校花网图片

Scrapy(抓取)

Scrapy终端（Scrapy shell）

scrapy的xpath，scrapy shell

scrapy的使用-scrapy shell

Scrapy：Scrapy shell

Scrapy Shell

Scrapy抓取360网站图片

使用scrapy抓取百度的图片

实战scrapy抓取站长图片数据

scrapy抓取cnblog新闻

使用Scrapy抓取数据

scrapy抓取dmoz内容

scrapy抓取网站

scrapy网页抓取项目

scrapy——抓取知乎

scrapy 抓取拉钩 ajax

scrapy抓取淘宝女郎

Scrapy 笔记本四（scrapy shell）

Scrapy 笔记本三（Scrapy shell）

Scrapy框架----04Scrapy Shell

【Python_Scrapy学习笔记（十三）】基于Scrapy框架的图片管道实现图片抓取

Scrapy Shell调试代码

scrapy爬虫shell用法

Scrapy Shell的使用

scrapy-shell

科学使用scrapy shell

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)