# 二(2.scrapy)Scrapy基本流程走通 - 代码天地

# 二(2.scrapy)Scrapy基本流程走通

其他 2018-06-11 05:07:28 阅读次数: 1

文章经过学习，如有错误，欢迎指出

创建我们的第一个spider

C:\Users\Alpaca\Desktop\scrapy\1-伯乐在线\firstspider>scrapy genspider myfirstspider www.baidu.com
Created spider 'myfirstspider' using template 'basic' in module:
  firstspider.spiders.myfirstspider

不同种类的spider

运行创建爬虫的命令时，加入-t 我们会发现他有四种不同的模式

常用的有两种 basic和crawl

文章之后会对这两种模板进行介绍

当我们创建完成一个spider的时候

class MyfirstspiderSpider(scrapy.Spider):
    name = 'myfirstspider'
    allowed_domains = ['www.baidu.com']
    start_urls = ['http://www.baidu.com/']

    def parse(self, response):
        pass

这里用的是basic模板，我会在第三篇博客上介绍crawl的模板(相当方便)

他是继承自spider的

name表示我们蜘蛛的名字在之后我们启动项目会用到他比如

scrapy crawl myfirstspider

后面的两个参数其实没什么用，我们完全可以自己定义

start_urls表示你的第一个进入的网站

scrapy shell

我们做爬虫的时候，大致的流程为，爬取页面。得到相应后用selector(xss,xpath,beautifulsoup)等工具对页面筛选。但是我们不可能一边又一遍的去运行我们的程序。这个时候我们可以使用scrapy shell命令，在终端进行测试

scrapy shell www.baidu.com

小心上当

当我们在用css或者xpath去筛选页面的时候，我们要知道，有一些页面是又js.css3.ajax渲染而成的，因此我们需要得到一个渲染之后的页面，这个时候请使用

view(response)

猜你喜欢

转载自blog.csdn.net/llh_e/article/details/80530084

# 二(2.scrapy)Scrapy基本流程走通

2.Scrapy基本命令介绍

2.scrapy框架持久化存储

Scrapy框架的学习(2.scrapy入门，简单爬取页面，并使用管道(pipelines)保存数据)

走通Django的基本流程

Scrapy基本操作流程

django自我学习之基本流程走通（二）

Django的基本流程走通01

scrapy框架爬虫基本流程

scrapy流程

Django基本流程走通02创建项目

scrapy 使用的基本流程和例子

浅析Scrapy框架运行的基本流程

scrapy基本的流程糗事百科

Scrapy框架爬虫基本使用流程

scrapy爬虫教程摘要（一）——基本流程

性能测试（二）：grafana流程走通

2 Scrapy

2-----Scrapy框架基本应用

django自我学习之基本流程走通（一）

scrapy

scrapy爬虫框架 (1. Scrapy的基本介绍、使用流程、分组打印、pipelines（管道）使用）

scrapy爬虫编写流程

scrapy 项目流程

爬虫 - scrapy执行流程

scrapy执行流程

scrapy操作流程

scrapy的概念和流程

scrapy工作流程

Scrapy框架原理及流程

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)