BS4 - 代码天地

BS4

其他 2018-11-13 17:14:58 阅读次数: 0

###BS4会将html文档对象转换为python可以识别的4种对象：
。。。 Tag:标签对象
。。。 NavigableString : 字符内容操作对象
。。。 BeautifulSoup: 文档对象
Beautiful Soup是一个可以从HTML或XML文件忠提取数据的Python库

                python 标准库：BeautifulSoup（markup，'html.parser')
                优点：Python的内置标准库，执行速度适中，文档容错能力强

                lxml  HTML 解析器：BeautifulSoup（markup，'lxml' )
                优点：速度快，文档容错能力强

                lxml XML 解析器：BeautifulSoup（markup，'xml' )
                优点：速度快，唯一支持XML的解析器

                html5lib：BeautifulSoup（markup，'html5lib' )
                优点：最好的容错性，以浏览器的方式解析文档，生成HTML5格式的文档

在这里插入图片描述
这是文件名称为westos.html的html内容
1.获取标签内容

在这里插入图片描述
从这里可以看到这是属于bs4类
soup.p则是获取p标签的内容

2.获取标签的属性
在这里插入图片描述

分别获取标签的属性并且修改属性

3.获取标签的文本内容&操作子节点
在这里插入图片描述

4.面向对象的匹配
在这里插入图片描述

由图可知第二个打印的是id为text ‘x’，x为任意数字
re.comile(’^d’) 意为以d开头的标签
5.css匹配

在这里插入图片描述
这是不同选择器的不同选择方法

猜你喜欢

转载自blog.csdn.net/weixin_42719822/article/details/83179890

bs4用法

bs4的使用

python的-bs4

BS4 keep on!

BS4

bs4使用

bs4源码

BS4模块

爬虫_BS4

bs4解析

爬虫-BS4

9、bs4

bs4中的BeautifulSoup

bs4库学习

Python Bs4 回顾

BS4库详解

Bs4 BeautifulSoup取值

bs4爬虫入门

Python之BS4

python(BS4模块)

Bs4 简单使用

python bs4库

python bs4 BeautifulSoup

No module named 'bs4'

bs4用法整理

request、bs4爬虫

python安装bs4

bs4的基本语法

python 之Bs4

python bs4(beautifulsoup4)

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)