python xpath 简单语法 - 代码天地

python xpath 简单语法

其他 2018-05-29 10:09:35 阅读次数: 4

1.例子

item['price'] = response.xpath('//span[@class="p-price"]/span[2]/text()').extract_first()

1.//开头表示如果我们不想定义它的父元素，就用//表示
2.匹配具体的属性值,这里是class=p-price的
3.xpath一级级用/来
4.[2] 表示第二个元素，xpath中第一个是1，不是0
5.获取标签内的文字用text()

2.例子2

item['color'] = response.xpath('//div[@id="choose-attr-1"]/div[@class="dd"]/div[contains(@class, \'item\')]/@data-value').extract()

1.如果有2个class，你只指定了一个class是无法匹配的，要用到contains进行匹配
2.属性用@xx, 比如图片的data-value，用@data-value

3.例子3

items = response.xpath('//div[@id="plist"]/ul/li[@class="gl-item"]')
        for product in items:
            item = JdsplashItem()
            item['price'] = product.xpath('.//strong[@class="J_price"]/i/text()').extract_first()
            # item['price'] = product.css('.J_price i::text').extract_first()
            item['img_url'] = product.css('.p-img img::attr("src")').extract_first()
            yield item

1. 如果div和li之间还有ul，也要写上，不能之间用//div[@id="plist"]/li[@class="gl-item"]来匹配，xpath是一层一层来解析的
2. 循环的时候，如果是从父元素开始匹配，要用.//，不能用//，//是全局的

http://www.codeblogbt.com/archives/61894

猜你喜欢

转载自blog.csdn.net/fox64194167/article/details/80470702

python xpath 简单语法

python爬虫xpath的语法

python - XPath 入门语法

介绍python Xpath语法

Python爬虫：Xpath语法笔记

Python爬虫之Xpath语法

python库的解析--xpath语法

Python爬虫-2 xpath语法

Python库：lxml——XPath语法

Python lxml 库与 XPath 语法

xpath简单语法

【Xpath】 xpath语法总结

python.scrapy爬虫-xpath查询语法

python爬虫学习之XPath基本语法

Python爬虫 XPath语法和lxml模块

用Python3练习XPath语法

python中lxml库与Xpath语法

快速掌握Python爬虫XPath语法！

xpath语法

xpath　语法

XPath 语法

[XPath]语法

python爬虫-简单使用xpath下载图片

Python中xpath的简单使用方法

python简单使用xpath查找网页元素

Python for Xpath

python xpath

XPath XPath常见语法

XPath 详解,总结 XPath 语法

8.3.1、Python__Xpath解析数据安装lxml，xpath解析文件，解析本地文件，xpath基本语法

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)