python 爬虫 scrapy框架的使用一 - 代码天地

python 爬虫 scrapy框架的使用一

其他 2018-11-02 22:48:17 阅读次数: 0

1 首先安装 scrapy ：

 pip  install  scrapy

2 用命令创建一个spider工程：

scrapy   startproject   spider5

3 创建一个spider文件，并指定爬虫开始的域名：

 scrapy  genspider spider1   “www.baidu.com”

4开启爬虫：

 scrapy  crawl   spider5

创建好的工程结构如下图：

其中spiders里面的为爬虫文件，items.py为爬虫数据模型定义文件,用于定义一些数据存储的类别,pipelines.py为管道文件,用于接收item的返回值,处理后将item保存到本地或者数据库中

scrapy的工作原理图如下:

1 首先 spider1文件会将start_urls中的请求连接发给引擎,然后引擎将这些请求传递给调度器(Scheduler),调度器接收这些请求链接并将它们入队列

2 然后通过引擎讲这些处理好的请求链接交给下载器去下载

3下载器将下载的结果通过引擎差传递给spiders进行数据解析,并返回一个item

4引擎将spiders的返回结果传递给管道文件(ItemPIpeline) ,管道文件接收数据将数据存储

猜你喜欢

转载自www.cnblogs.com/beifangls/p/9898782.html

Python使用Scrapy框架爬虫（一）

python 爬虫 scrapy框架的使用一

Python爬虫框架Scrapy入门（一）Scrapy安装及基本使用

Python 爬虫（一）scrapy框架

python 爬虫 scrapy框架（一）

Python爬虫框架Scrapy的使用

python爬虫 scrapy爬虫框架的基本使用

Python爬虫框架Scrapy实例（一）

Python Scrapy 爬虫框架实例（一）

python爬虫攻略（一）：Scrapy框架

Python爬虫-Scrapy框架（一）- Scrapy环境安装

python使用Scrapy框架进行爬虫编程

Python Scrapy爬虫框架之初次使用

Python爬虫--使用scrapy框架(1)

Python爬虫--使用scrapy框架(2)

python爬虫练习(使用scrapy框架)

python爬虫框架--scrapy 基本使用

python 爬虫 scrapy框架的详细使用

python爬虫笔记（七）:使用Scrapy框架

Python爬虫 --- 2.3 Scrapy 框架的简单使用

Python爬虫之Scrapy框架使用selenium

python爬虫框架：scrapy 的安装与使用

Python爬虫之Scrapy框架的基本使用

Python 后端爬虫Scrapy 框架使用

Python:爬虫框架Scrapy的安装与基本使用

python爬虫之scrapy框架的使用-基础

Python的爬虫框架Scrapy基本使用

Python爬虫基础（五）：使用scrapy框架

Python爬虫_Scrapy(一)

Python的网络爬虫框架-Scrapy爬虫框架的使用

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)