Scrapy框架的使用 -- 自动跳转链接并请求 - 代码天地

Scrapy框架的使用 -- 自动跳转链接并请求

其他 2019-03-04 17:28:04 阅读次数: 0

# -*- coding: utf-8 -*-
import scrapy
from movie.items import MovieItem


class MoviespiderSpider(scrapy.Spider):
    name = 'moviespider'
    # allowed_domains = ['www.movie.com']
    start_urls = ['https://www.4567tv.tv/index.php/vod/show/id/1.html']

    def detail_parse(self, response):
        item = response.meta['item']
        director = response.xpath('/html/body/div[1]/div/div/div/div[2]/p[3]/a/text()').extract()

        item['director'] = director

        yield item

    def parse(self, response):
        li_list = response.xpath('//li[@class="col-md-6 col-sm-4 col-xs-3"]')
        for li in li_list:
            title = li.xpath('./div/a/@title').extract_first()
            actor = li.xpath('./div/div/p/text()').extract_first()
            detail_url = 'https://www.4567tv.tv' + li.xpath('./div/a/@href').extract_first()

            item = MovieItem()

            item['name'] = title
            item['actor'] = actor

            # 第一个解析的函数中不直接yield item, yield scrapy.Request()对象 传入下一个连接的url 

            yield scrapy.Request(url=detail_url, callback=self.detail_parse, meta={'item': item})

View Code

猜你喜欢

转载自www.cnblogs.com/Treasuremy/p/10471792.html

Scrapy框架的使用 -- 自动跳转链接并请求

Scrapy是什么?Scrapy怎么用?Scrapy进阶使用[链接提取器、自动登录、图片(文件)下载器](基于scrapy2.0+编写) ๑乛◡乛๑ Scrapy框架使用方法

scrapy框架----post请求方式

Python爬虫框架Scrapy的基本使用方法（以爬取加密货币GitHub链接为例）

关于python在爬虫scrapy框架，使用happybase方法链接hbase进行数据上传操作

Scrapy框架-对分页使用链接提取器CrawlSpider爬取每页的数据

使用scrapy框架爬取淘车网的列表页和详情页的信息，实现scrapy框架的好几级的请求

Scrapy框架学习 - Scrapy框架的安装与使用

Scrapy框架的初步使用

Scrapy框架的安装及使用

Scrapy框架基础使用

scrapy框架的基本使用

scrapy框架-post使用

scrapy框架的入门使用

scrapy框架使用教程

scrapy框架的使用

scrapy框架的简单使用

Scrapy框架使用代理

scrapy 框架基本使用

scrapy框架基本使用

Scrapy 框架的使用

爬虫框架Scrapy 的使用

Scrapy爬虫框架的使用

Scrapy框架解析,使用

爬虫系列爬虫的Robots协议请求库之requests库解析库beautifulsoup 爬取汽车之家新闻搭建免费代理池验证码破解模拟自动登录网站 xpath路径 selenium简介与安装 selenium的使用 Scrapy 架构介绍 scrapy 框架的安装与启动 scrapy项目架构与配置文件 Scrapy中response属性以及内容提取爬取数据并解析 Scrapy 持久化

【Scrapy框架实现发送POST请求】

【Scrapy框架之请求传参案例】

爬虫scrapy框架（7）——post请求

爬虫scrapy框架（8）——添加请求头

Scrapy框架的使用之Scrapy对接硒

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)