Scrapy框架爬虫学习--1 - 代码天地

Scrapy框架爬虫学习--1

编程语言 2018-06-14 00:07:17 阅读次数: 2

写在前面：今天上午把手势控制播放器的Demo弄完了。可以学习自己的东西了。因为要找爬虫的实习，所以学习一下Scrapy框架的爬虫。这个和之前做的脚本爬虫是对应的。不过好像是说Scrapy的分布式爬虫更加牛逼，没有不可以爬的网站。

1. 安装

2. 来看一下基本的操作。

在终端下输入 scrapy shell url，就相当于之前的Request请求

请求之后可以看一下 response，可以看到200请求成功。

这时候View(response)，就可以用系统默认浏览器打开刚刚返回的数据。至此就获得了源码，就是response。

下面看一下用Xpath获取元素。这个也很简单，用chrome的开发者工具，选中目标元素，右键就可以copy其Xpath。

然后在终端输入 response.xpath('对应的xpath路径').extract()，就会返回对应的元素。注意这里路径是单引号！！！（应该是版本问题）

然后通过分析一下网页源码的标签就可以看到，用id是不可能得到所有的价格信息的。这里用标签中的类名class 来筛选所有的。将xpth路径替换为//*[@class="f-list-item ershoufang-list"]/dl/dd[5]/div[1]/span[1]，注意这里后面的不变（代表着相应的价格元素位置关系不变）。之后就可以匹配到所有的价格信息。

可以看到这里用Xpath来获取这些元素信息非常方便，不用去特别关注那些标签的关系，xpath直接就帮你定位好了，只需换前面的大的类定位即可。所以说，要会更多的方法，不同的方法在不同的情况下，会有意想不到的方便。

猜你喜欢

转载自blog.csdn.net/Mike_Shine/article/details/80665461

Scrapy框架爬虫学习--1

网络爬虫Scrapy框架学习1

爬虫框架Scrapy学习笔记-1

scrapy爬虫框架学习

python爬虫框架——scrapy（1）scrapy爬虫框架介绍

学习随笔 Scrapy爬虫框架

Scrapy框架爬虫学习--2

python爬虫框架——Scrapy学习

爬虫框架Scrapy学习（一）

Python Scrapy爬虫框架学习

python爬虫框架Scrapy学习

爬虫Scrapy框架学习（一）

爬虫scrapy框架学习（三）

爬虫scrapy框架学习（二）

Scrapy爬虫框架学习一

学习笔记 scrapy 爬虫框架

Python爬虫--使用scrapy框架(1)

Scrapy1.6 爬虫框架1 安装

爬虫利器Scrapy框架：1:概要介绍

13、Python Scrapy Web爬虫框架【1】

Python学习---爬虫学习[scrapy框架初识]

【python学习】scrapy爬虫框架学习

爬虫初阶（六）—— Scrapy框架（1）scrapy的基础概念

爬虫学习之scrapy框架入门

Python爬虫框架Scrapy学习笔记原创

网络爬虫Scrapy框架学习2

Python学习笔记——爬虫之Scrapy框架

Python爬虫框架Scrapy学习笔记

大数据-爬虫框架学习--scrapy

学习Python爬虫必备框架：Scrapy

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)