python爬虫解析库学习

其他 2018-11-14 21:54:36 阅读次数: 0

一、xpath库使用：

　　1、基本规则：

　　　2、将文件转为HTML对象：

1 html = etree.parse('./test.html', etree.HTMLParser())
2 result = etree.tostring(html)
3 print(result.decode('utf-8'))

　　　　3、属性多值匹配：

　　　　//a[contains(@class,'li')]

　　　4、多属性匹配：

　　　　　　//a[@class="a" and @font="red"]

　　　5、按序选择：

二、beautifulsoup库学习：

　　1、基本初始化：

　　　　将HTML字符串用lxml格式来解析，并补全标签，创建html处理对象。

　　2、获取信息：

　　　　（1）获取title的name属性：

　　　　　　soup.title.name

　　　　（2）获取多属性：

html = etree.parse('./test.html', etree.HTMLParser())
result = etree.tostring(html)
print(result.decode('utf-8'))

猜你喜欢

转载自www.cnblogs.com/monty12/p/9960572.html

python爬虫解析库学习

python爬虫学习——解析库pyquery的使用

Python爬虫常用库及解析库解析

【python爬虫专题】解析方法 <4> BeautifulSoup库学习

[ Python ] 爬虫类库学习之 re 正则解析

【Python爬虫】PyQuery解析库

python爬虫-3 解析库

Python爬虫解析库之xpath解析库详解

Python爬虫解析库之BeautifulSoup解析库详解

Python爬虫【解析库之beautifulsoup】

python | 爬虫笔记（四）- 解析库使用

Python-爬虫-解析库（pyquery）的使用

Python 爬虫解析库的使用 --- Beautiful Soup

Python爬虫解析库之pyquery详解

python爬虫6--lxml解析库

python爬虫8--pyquery解析库

python爬虫7--BeautifulSoup解析库

python爬虫智能解析库详解

Python爬虫利器之解析库的使用

【Python爬虫学习笔记4】结合Xpath与lxml库解析数据

【Python爬虫学习实践】基于Xpath和lxml库解析网站

【Python3 爬虫学习笔记】解析库的使用 11 —— 使用pyquery 4

【Python3 爬虫学习笔记】解析库的使用 10 —— 使用pyquery 3

【Python3 爬虫学习笔记】解析库的使用 9 —— 使用pyquery 2

【Python3 爬虫学习笔记】解析库的使用 8 —— 使用pyquery 1

【Python3 爬虫学习笔记】解析库的使用 7 —— Beautiful Soup 5

【Python3 爬虫学习笔记】解析库的使用 5 —— Beautiful Soup 3

【Python3 爬虫学习笔记】解析库的使用 4 —— Beautiful Soup 2

【Python3 爬虫学习笔记】解析库的使用 3 —— Beautiful Soup 1

【Python3 爬虫学习笔记】解析库的使用 2 —— 使用XPath 2

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)