使用 PyQuery - 代码天地

使用 PyQuery

其他 2019-03-15 08:34:40 阅读次数: 0

PyQuery 用法：

(1) 前面我们爬取一个网页，都是使用正则表达式来提取想要的信息，但是这种方式比较复杂，一旦有一个地方写错，就匹配不出来了，因此我们可以使用 PyQuery
(2) PyQuery 是一个网页解析库，如果你觉得正则写起来太麻烦，如果你觉得 BeautifulSoup 语法太难记，如果你熟悉 jQuery 的语法，那么，PyQuery就是你绝佳的选择
(3) 提供了和 jQuery 类似的语法来解析 HTML 文梢，支持 CSS 选择器，安装方法：pip3 install pyquery

from pyquery import PyQuery as pq

html = '''
    <!DOCTYPE html>
    <html lang="en">
    <head>
        <meta charset="UTF-8">
        <title>首页</title>
    </head>
    <body class="item">
        <p class="item" id="username">This is your username</p>
        <p class="item" id="password">This is your password</p>
    </body>
    </html>
'''

doc = pq(html)                     # 初始化一个PyQuery对象，可以传入字符串 、传入URL 、传入文件名
                                   # 也可以传入URL或文件名：pq(url="http://www.baidu.com/") 、pq(filename="./index.html")
result = doc('title')              # 表示提取<title>节点，结果为：<title>首页</title>
result = doc('.item')              # 可以基于CSS选择器来进行提取，这里表示提取class="item"的所有节点
result = doc.find('p')             # find()方法会将符合条件的所有节点选择出来，这里表示提取所有<p>节点
result = doc.find('p').attr('id')  # attr()用于获取节点的属性值，这里表示获取id属性的值，结果为：username
result = doc.find('p').text())     # text()用于获取节点的文本内容，结果为：This is your username This is your password

猜你喜欢

转载自www.cnblogs.com/pzk7788/p/10534707.html

pyquery的使用

pyquery 的使用

使用pyquery

使用 PyQuery

pyquery使用详解

pyquery的基本使用

PyQuery库使用详解

PyQuery库的使用

如何使用PyQuery库？

PyQuery

（廿）Python爬虫：pyquery的使用

pyquery 基本使用笔记

爬虫（十二）：pyquery库的使用

爬虫利器pyquery使用介绍

pyquery详细用法 python爬虫之PyQuery的基本使用

Pyquery解析库的安装和使用

爬虫--解析库的使用 XPath、BeautifulSoup、pyquery

python爬虫神器PyQuery的使用方法

自学python爬虫（六）PyQuery使用

Python-爬虫-解析库（pyquery）的使用

Python 爬虫：PyQuery 库的介绍与使用

python之爬虫（九）PyQuery库的使用

数据爬虫（六）：爬虫PyQuery基本使用

爬虫之PyQuery库的使用（八）

Python中PyQuery库的使用总结

python爬虫学习——解析库pyquery的使用

爬虫学习记录（三）————PyQuery解析使用

python爬虫之PyQuery的基本使用

Python使用PyQuery解析网页元素

pyquery - PyQuery完整的API

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)