Scrapy 简单操作

其他 2018-06-02 11:12:23 阅读次数: 0

现在shell里面

scrapy startproject tutorial

然后

cd tutorial

scrapy genspider quotes quotes.toscrape.com

观察原始页面发现数据存储在3个内容里面

text

author

tags

然后修改Items.py

# -*- coding: utf-8 -*-

# Define here the models for your scraped items
#
# See documentation in:
# https://doc.scrapy.org/en/latest/topics/items.html

import scrapy


class QuoteItem(scrapy.Item): 
　　text= scrapy.Field() 
　　author=scrapy.Field() 
　　tags= scrapy.Field()

　　def parse(self, response):
  　　  quotes = response.css('.quote')
 　　   for quote in quotes:
  　　      text = quote.css('.text::text').extract_first()
 　　       author = quote.css('.author::text').extract_first()
 　　       tags = quote.css('.tags .tga::text').extract()

猜你喜欢

转载自www.cnblogs.com/zj0724/p/9124756.html

Scrapy 简单操作

scrapy专利爬虫（一）——scrapy简单介绍

scrapy 简单爬虫实验

scrapy的简单demo

scrapy简单爬虫（一）

scrapy简单实战

scrapy简单实践

py scrapy 简单命令

一、Scrapy的简单使用

scrapy简单入门

scrapy的简单使用

简单scrapy框架实例

scrapy框架简单了解

scrapy框架的简单使用

简单的scrapy实例

Scrapy爬虫简单实例

scrapy爬虫简单案例

Scrapy基本操作流程

Scrapy入门操作

scrapy操作流程

scrapy操作指南

scrapy基本操作

scrapy高级操作

scrapy ip 代理操作

Scrapy 安装及基础操作

scrapy专利爬虫（三）——简单实际操作

Scrapy入门：简单爬虫项目梳理整个框架操作流程

Scrapy简单入门及实例讲解

scrapy以及redis简单应用

scrapy爬虫框架简单实例

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)