response.follow作为创建Request对象 - 代码天地

response.follow作为创建Request对象

其他 2018-10-31 02:18:49 阅读次数: 0

import scrapy


class QuotesSpider(scrapy.Spider):
    name = "quotes"
    start_urls = [
        'http://quotes.toscrape.com/page/1/',
    ]

    def parse(self, response):
        for quote in response.css('div.quote'):
            yield {
                'text': quote.css('span.text::text').extract_first(),
                'author': quote.css('span small::text').extract_first(),
                'tags': quote.css('div.tags a.tag::text').extract(),
            }

        next_page = response.css('li.next a::attr(href)').extract_first()
        if next_page is not None:
            yield response.follow(next_page, callback=self.parse)

与scrapy.Request不同，response.follow直接支持相对URL - 无需调用urljoin。请注意，response.follow只是返回一个Request实例；你仍然需要产生这个请求。

您也可以将选择器传递给response.follow代替字符串；该选择器应该提取必要的属性：

for a in response.css('li.next a'):
    yield response.follow(a, callback=self.parse)

注意

response.follow(response.css('li.next a'))无效，因为response.css返回一个包含所有结果选择器的类似列表的对象，而不是单个选择器。如上例所示的for循环，或response.follow(response.css('li.nexta')[0])是可以的。

总结： response.follow（）

①支持相对url

②能返回单个选择器

猜你喜欢

转载自blog.csdn.net/pythonisnotshell/article/details/80538685

response.follow作为创建Request对象

response.follow作为创建Request对象使用response.follow()方法时出现AttributeError: 'HtmlResponse' object has no attribute 'follow'，如何解决？

Scrapy中scrapy.Request和response.follow的区别

scrapy框架scrapy.Reqest和response.follow的区别

request与response对象

request和response对象

Django Request 与Response对象

Servlet：response，request对象

Request对象和Response对象

Java Request和Response对象 - Response篇

ZooKeeper的request和response对象

JavaWeb Request与Response对象理解

【nodejs】request 和 response 对象

Request对象和Response session

Request和Response对象讲解

JavaWeb（7）request response对象

Request&response对象原理

JavaWeb之Request与Response对象

request&response对象的原理

Request和Response对象详解

nodejs request & response 对象api

Java Request和Response对象 - Request篇

API，Request 对象和Response 对象

java Request对象和Response对象详解

Django中request对象与response对象

Servlet（1）--request对象，response对象

request对象和response对象（Servlet）

Struts2中对request ，response，session 对象的创建和操作

【HTTP协议基础部分】request/response对象

在Action中获取request、response、session对象

今日推荐

周排行

联发科MT6139射频处理器工作原理分析

LeetCode-191. 位1的个数

kubernetes中挂载glusterfs并使用

MetricBeat（win/linux）部署系统CPU内存等资源情况监控

京东，想说爱你，并不容易！

CSS文本笔录

标题栏和状态栏同色

[校内互测]20170402

#3194. 去月球

gitlab学习(7)---gitlab数据恢复

每日归档

更多

2024-06-15(0)

2024-06-14(0)

2024-06-13(0)

2024-06-12(0)

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)