python3爬虫开发 Scrapy的使用基本知识

其他 2019-03-05 01:26:34 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_36869808/article/details/87908579

笔记

1.安装

这个可以搜索自行安装。

2.scrapy基础使用

1.创建工程
scrapy startproject baidu

2.切换目录
cd baidu

3.创建爬虫
scrapy genspider example baidu.com

4.运行爬虫
scrapy crawl example

3.设置scrapy不遵守robots协议

在文件里有一个settings.py的文件

将robots改为False即可

4.使用python运行scrapy

创建一个main.py

from scrapy import cmdline
cmdline.execute("scrapy crawl example".split())

5.scrapy 使用xpath的方法

在正常的xpath的使用过程中，增加了extract()
eg：

title=response.xpath("//title//text()").extract()

6.scrapy 的文件结构

spiders文件夹：存放爬虫文件的文件夹
items.py：定义需要抓取的数据
pipelines.py：股则数据抓取以后的工作
settings.py:爬虫的各种配置信息

猜你喜欢

转载自blog.csdn.net/qq_36869808/article/details/87908579

python3爬虫开发 Scrapy的使用基本知识

Python3 基本知识

《python3网络爬虫开发实战》--Scrapy

python3爬虫开发 Scrapy+MongoDB

python爬虫基本知识

爬虫的基本知识

python基本知识

python的基本知识

Python3网络爬虫开发实战——第3章基本库的使用

【Python3 爬虫学习笔记】Scrapy框架的使用 3

python3 几个简单基本知识点

python3 爬虫——scrapy文档

python开发爬虫-Python3 Scrapy 安装方法（一脸辛酸泪）

《python3网络爬虫开发实战》--基本库的使用

python3爬虫之安装和使用scrapy

【Python3 爬虫学习笔记】Scrapy框架的使用 4

python3使用scrapy爬虫数据录入mysql

scrapy 框架使用的基本知识

python的爬虫基本知识介绍

scrapy基本知识

get和post获取数据的基本知识//python爬虫之requests的基本使用

前端开发的基本知识

hadoop基本知识3

Python3 爬虫使用代理 IP

Python3爬虫urllib使用介绍

Python3爬虫requests使用

Python3爬虫urllib库的使用

python：基本知识（一）

python: 基本知识（二）

python复习基本知识

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)