爪巴虫根据text文本内容搜索标签 - 代码天地

爪巴虫根据text文本内容搜索标签

其他 2020-09-21 11:06:28 阅读次数: 0

本文地址：https://goodgoodstudy.blog.csdn.net/article/details/108585966

在这里插入图片描述

from bs4 import BeautifulSoup

bs = BeautifulSoup(html)

col = bs.find('div', {
    
    'class':'col'})

col.findAll('a')
"""
[<a href="/paper/2020">Proceedings of the International Conference on Machine Learning 1  pre-proceedings (ICML 2020)</a>,
 <a class="btn btn-light btn-sm btn-spacer disabled" download="" href="/paper/2020/file/ec7f346604f518906d35ef0492709f78-Bibtex.bib">Bibtex »</a>,
 <a class="btn btn-light btn-sm btn-spacer" href="/paper/2020/file/ec7f346604f518906d35ef0492709f78-Metadata.json">Metadata »</a>,
 <a class="btn btn-light btn-sm btn-spacer" href="/paper/2020/file/ec7f346604f518906d35ef0492709f78-Paper.pdf">Paper »</a>,
 <a class="btn btn-light btn-sm btn-spacer" href="/paper/2020/file/ec7f346604f518906d35ef0492709f78-Supplemental.pdf">Supplemental »</a>]
"""

现在需要找得是 text 部分含有 supplement 的 a 标签

import re
col.findAll('a',text= re.compile('Supplemental.*'))
"""
[<a class="btn btn-light btn-sm btn-spacer" href="/paper/2020/file/ec7f346604f518906d35ef0492709f78-Supplemental.pdf">Supplemental »</a>]
"""

成功！

猜你喜欢

转载自blog.csdn.net/itnerd/article/details/108585966

爪巴虫根据text文本内容搜索标签

Python爪巴虫

京东爪巴虫

baidu文库爪巴虫——xls

baidu文库爪巴虫——txt

baidu文库爪巴虫——doc

selenium 知网爪巴虫

知网爪巴虫 2.0

爪巴虫下载 github 指定目录

百度百科爪巴虫

jQuery根据文本内容text进行选择

多线程爪巴虫下载进击的巨人 v.1

多线程爪巴虫抓取 ICML 2020 补充材料连链接

多线程爪巴虫下载进击的巨人 v.2

slider控制text文本内容

js搜索文本内容

ACM蒟蒻的爪巴之路

python 根据标签名获取标签内容

Unity 根据文本自适应Text大小

Unity根据Text内容设置宽高

unity UGUI 根据text中文本的长度改变text的大小

文本修饰标签（text-decoration）

Tkinter 之Text文本框标签

jquery处理select,text等input标签内容

tkinter 删除Text文本框内的内容

flutter Text自动计算文本内容的宽度

input type="text" 标签中如果设置value属性，在输入框中输入文本，最后会提交value的值还是文本框中的内容？

Vue根据富文本内容生成目录

虫食算（搜索）

两种方法，实现根据文本内容查找元素，使用.text()时，一定要.trim()掉两边的空格

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

周排行

ORACLE 跟踪文件详细解释

20190924-LeetCode解数独题目分享

分治法实例-找下标，下标与对应值相等

安全测试学习笔记

JavaScript笔记：原型和原型链

在Linux中检查可用内存的5种方法

BUAA_OO_JML

mongodb创建用户、备份、恢复等

生活20190602

使用MoveIt!配置软件包在RViz中进行机器人运动规划

每日归档

更多

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)