如何使用bs4爬虫解析html - 代码天地

如何使用bs4爬虫解析html

其他 2020-04-08 10:39:02 阅读次数: 0

Beautiful Soup简介
Beautiful Soup安装
Beautiful Soup用法

Beautiful Soup简介

官方网址：https://beautifulsoup.readthedocs.io/zh_CN/latest/
Beautiful Soup是一个可以从HTML文件中提取数据的Python库，它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式
在接口测试中用于验证页面内容的正确性

Beautiful Soup安装

Windows 下命令行输入：pip install beautifulsoup4 即可。

Beautiful Soup用法

from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc,"html.parser")
print soup
print type(soup)
print soup.prettify()# 按照标准的缩进格式的结构输出
# 通过标签名称来获取Tag对象，如果有多个相同的标签名称，返回第一个
print soup.html
print soup.body
print soup.title
print type(soup.title)# class类，tag标签
print soup.find_all('a')# 查找所有a标签
print soup.find_all('a')[2]# 查找第二个a标签
print soup.title.string# 输出字符串格式String
print soup.b.string # 输出注释

#find只返回第一个
print soup.find("id='''")

发布了18 篇原创文章 · 获赞 13 · 访问量 2314

私信关注

猜你喜欢

转载自blog.csdn.net/m0_37518413/article/details/103228958

如何使用bs4爬虫解析html

python爬虫系列三：html解析大法-bs4

Python 爬虫 bs4 数据解析基本使用

Python爬虫bs4解析实战

爬虫之用bs4解析数据

爬虫_BS4

爬虫-BS4

beautifulsoup爬虫使用-bs4

python爬虫教程：bs4的使用

bs4解析

解析库bs4的使用

python爬虫之下载盗墓笔记（bs4解析HTML）

【Python】爬虫-----数据解析之Bs4解析

bs4的使用

bs4使用

爬虫：基于bs4库的html内容查找方法

Python爬虫BS4库的解析器正确使用方法

bs4爬虫入门

request、bs4爬虫

Python 爬虫之数据解析模块bs4基础

doraemon的python 爬虫（数据解析——正则、bs4、xpath）

Python爬虫之旅_(数据解析)_bs4

python爬虫学习（十）bs4解析数据

网络爬虫之网页数据解析（bs4）

Python爬虫学习笔记（六）————BeautifulSoup（bs4）解析

爬虫学习（05）: 数据解析_bs4篇

Python爬虫(十五)_案例：使用bs4的爬虫

010 python接口 bs4解析html

HTML网页解析之Xpath,bs4及re

python爬虫基础知识——requests、bs4的使用

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)