借鉴scrapy三大基本模块 - 代码天地

借鉴scrapy三大基本模块

其他 2018-09-27 10:16:58 阅读次数: 0

request

class Request(object):
def init(self, url, method=‘GET’, params=None, headers=None, data=None,parse=‘parse’,meta=None):
self.url = url
self.method = method
self.params = params
self.headers = headers
self.data = data
self.parse = parse
self.meta = meta

response

from lxml import html
import json
import re

class Response(object):
def init(self, url, status_code, headers, body, meta=None):
self.url = url
self.status_code = status_code
self.headers = headers
self.body = body
self.meta = meta

def xpath(self, rule):  # 添加xpath的方法
    res = html.etree.HTML(self.body)
    return res.xpath(rule)

@property
def json(self):  # 添加解析json的方法
    return json.loads(self.body)

def findall(self, rule, body):  # 添加正则的方法
    return re.findall(rule, body)

item

class Item(object):
def init(self,data):
self._data = data
@property
def data(self):
return self._data

猜你喜欢

转载自blog.csdn.net/s2965713873/article/details/82862064

借鉴scrapy三大基本模块

j借鉴scrapy五大核心模块

三大基本结构

三大基本排序

数据挖掘三大模块

Node 三大模块【详细】

借鉴

python爬虫系列（三）scrapy基本概念

ssm三大框架基本配置

c#三大基本结构

三大范式的基本概念

web开发的三大基本语言

三大基本排序---插入，选择，冒泡

Android 三大动画的基本使用

数据设计三大基本范式

java 三大基本特征

面向对象三大基本特性

Qt基本控件及三大布局

C#—三大基本结构

Java的三大特性（基本特征）

Node.js的基本模块学习(三)

SpringCloud 框架基本模块梳理（三）

Scrapy-requests模块

安装scrapy模块失败

python模块之scrapy

scrapy模块安及使用

Scrapy模块的使用

Scrapy之twisted模块

面向对象三大基本特性,五大基本原则面向对象三大基本特性,五大基本原则

（三）LoadRunner三大组件、工作原理、测试基本流程

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)