scrapy 单独执行 spider - 代码天地

scrapy 单独执行 spider

其他 2018-11-06 13:23:35 阅读次数: 0

爬虫 scrapy 单独执行 spider模块

创建 .py 文件名称随意可用 minispider.py

内容

class Minispider(scrapy.Spider):
name = 'minaspider'

def start_requests(self):
    print('1, start request')
    urls = ['http://www.qidian.com/','http://www.baidu.com/']

    for url in urls:
        print('2,实例化')
        req = scrapy.Request(url,callback=None)
        print('3,生成器')
        yield req

def parse(self, response):
    print('4,parse解析')
    print(response)

start_requests为重写父类的方法。返回值是可迭代对象。对象中元素类型为scrapy.Resquest的实例化
urls 表示要爬取的地址
使用for 循环依次取出url值，实例化scrapy.Resquest(url,callback=None)
url 为地址。callback为None表示回调函数默认是parse。

终端执行：scrapy runspider minispider.py --nolog
–nolog 表示不打印日志
执行结果为：
1, start request
2,实例化
3,生成器
2,实例化
3,生成器
4,parse解析
<200 http://www.baidu.com/>
4,parse解析
<200 https://www.qidian.com/>

猜你喜欢

转载自blog.csdn.net/dandanfengyun/article/details/83513672

scrapy 单独执行 spider

scrapy crawl spider执行报错(windows)

Scrapy——Spider

Scrapy: Spider

scrapy框架【spider】 scrapy框架之spider

scrapy spider及其子类

Scrapy-Spider

Scrapy spider实例

Scrapy启动spider出错

scrapy原码解读---Spider

scrapy-items & spider

spider----scrapy框架

scrapy学习之spider

Scrapy Spider MiddleWare 设置

Scrapy中的Spider Middleware

Spider——scrapy运行报错

Spider_scrapy

scrapy框架之spider

Scrapy之Spider

Scrapy——Spider Middleware

Scrapy spider 主要方法

scrapy-spider类分析

Spider-scrapy日志处理

Scrapy_多个spider并行

scrapy 4 学习 crawl spider

爬虫框架Scrapy的组件spider

scrapy篇(2)scrapy中的spider部分

创建Scrapy项目，创建spider，运行Scrapy

Python3使用Scrapy2.4框架爬取数据，多个spider同时执行

scrapy 监控spider启动和关闭

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)