Scrapy框架基础使用 - 代码天地

Scrapy框架基础使用

其他 2018-06-28 12:38:44 阅读次数: 2

1、流程框架

2、在命令行中输入scrapy，会有scrapy常见命令参数

在命令中输入scrapy startproject quote创建一个叫quote的项目

cd到创建好的项目目录中，然后执行scrapy genspider quotes quotes.toscrape.com，创建spider，指定spider名称--->quotes，

指定spider抓取的网址-->quotes.toscrape.com

这是一个scrapy框架默认目录结构

scrapy.cfg --> 配置文件，指定settings配置文件路径

quote/ ---> 该项目的python模块，之后您将在此加入代码。

quote/items.py --> 用来保存数据接口

quote/middlewares.py --> 存储中间件

quote/pipelines.py --> 项目中的pipelines文件

quote/settings.py --> 定义一些配置信息

quote/spiders/ --> 放置spider代码的目录

3、在命令行中输入scrapy crawl quotes，会输出一些配置信息

scrapy还有一个命令行调试模式，直接在命令行执行scrapy shell quotes.toscrape.com

extract_first是输入第一个匹配的，是字符串，extract是匹配有多个结果的，输出列表类型

执行scrapy crawl quotes -o quotes.json可以保持到本地文件，还支持quotes.jl .csv ，还有支持向ftp传输数据

scrapy crawl -o ftp://user:[email protected]/path/quotes.csv

使用-o是可以指定保持需要的文件格式，这个保持方法scrapy都已经集成好了

4、抓取了一个网址先测试scrapy，具体代码请参考GitHub

https://github.com/watchxu/python/tree/master/ScrapyQuotes

猜你喜欢

转载自www.cnblogs.com/watchslowly/p/9238048.html

Scrapy框架基础使用

python爬虫之scrapy框架的使用-基础

Python爬虫基础（五）：使用scrapy框架

Scrapy框架基础

Scrapy框架学习 - Scrapy框架的安装与使用

Scrapy框架的初步使用

Scrapy框架的安装及使用

scrapy框架的基本使用

scrapy框架的入门使用

scrapy框架-post使用

scrapy框架使用教程

scrapy框架的使用

scrapy框架的简单使用

Scrapy框架使用代理

scrapy 框架基本使用

scrapy框架基本使用

Scrapy 框架的使用

Scrapy爬虫框架的使用

爬虫框架Scrapy 的使用

Scrapy框架解析,使用

Scrapy是什么?Scrapy怎么用?Scrapy基础使用(基于scrapy2.0+编写) ๑乛◡乛๑ Scrapy框架使用方法

11.Scrapy框架基础-使用Scrapy抓取数据并保存到mongodb

Scrapy框架的使用之Scrapy对接硒

Scrapy框架的使用之Scrapy对接Selenium

Scrapy框架的使用之Scrapy对接硒

Scrapy框架的使用之Scrapy通用爬虫

【爬虫框架-scrapy】scrapy工具的使用

scrapy基础使用2

scrapy框架中crawlspider的使用

爬虫scrapy框架安装使用

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)