#Python爬虫（二）##太原理工大学机器人团队20天学习打卡day13 - 代码天地

#Python爬虫（二）##太原理工大学机器人团队20天学习打卡day13

编程语言 2020-03-16 22:03:31 阅读次数: 0

为了更好地提取信息，我们就需要先了解信息的标记方法，目前网页普遍使用HTML（HyperText Markup Language),可以说明文字，声音，图像，视频和链接的超文本标记语言
HTML基本格式
在这里插入图片描述
这三个可等同看待

HTML（标签树）内容遍历需要使用beautifulsoup库（安装beautifulsoup4)，其是解析，遍历，维护标签树的功能库

在这里插入图片描述
beautifulsoup库有四种解析库，我们正常就用第一种解析HTML
基本元素
我们在得到HTML内容后会发现其十分杂乱，内容不清晰
这是我们可以使用bs4库中的prettify（）

对特定内容的检索

知识点十分多且琐碎，需慢慢消化，下篇文章会讲实例，进行实战。

蓝天呀

发布了13 篇原创文章 · 获赞 30 · 访问量 4968

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_46424753/article/details/104908270

#Python爬虫（二）##太原理工大学机器人团队20天学习打卡day13

#Python爬虫（一）##太原理工大学机器人团队20天学习打卡day12

#Python入门（二）##太原理工大学机器人团队20天学习打卡day2

#Python入门（四）##太原理工大学机器人团队20天学习打卡day4

#Python入门（三）##太原理工大学机器人团队20天学习打卡day3

#Python入门（一）##太原理工大学机器人团队20天学习打卡day1

#Python(九）##太原理工大学机器人团队20天学习打卡day9

#Python入门（八）##太原理工大学机器人团队20天学习打卡day8

#Python入门（十一）##太原理工大学机器人团队20天学习打卡day11

#Python入门（十）##太原理工大学机器人团队20天学习打卡day10

#Python入门（六）##太原理工大学机器人团队20天学习打卡day6

#Python入门（五）##太原理工大学机器人团队20天学习打卡day5

#Python入门（七）##太原理工大学机器人团队20天学习打卡day7

太原理工大学机器人团队20天学习打卡day4（模拟电路初步）

太原理工大学机器人团队20天学习打卡day3（模拟电路初步）

太原理工大学机器人团队20天学习打卡day1（模拟电路初步）

太原理工大学机器人团队20天学习打卡day2（模拟电路初步）

太原理工大学机器人团队20天学习打卡day2（模拟电路初步）

太原理工大学机器人团队20天学习打卡day2（模拟电路初步）

#太原理工大学机器人团队#C51单片机学习20天打卡——Day 1

#太原理工大学机器人团队#51单片机20天学习打卡——Day2

#太原理工大学机器人团队#51单片机20天学习打卡——Day3

太原理工大学机器人团队20天学习打卡day8（51单片机初步）

太原理工大学机器人团队20天学习打卡day9（51单片机初步）

太原理工大学机器人团队20天学习打卡day9（51单片机初步）

太原理工大学机器人团队20天学习打卡day6（模拟电路初步）

太原理工大学机器人团队20天学习打卡day4（模拟电路初步）

太原理工大学机器人团队20天学习打卡day3（模拟电路初步）

太原理工大学机器人团队20天学习打卡day3（模拟电路初步）

#太原理工大学机器人团队#51单片机20天学习打卡——Day4

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

第五讲：AbstractBean以及Ioc常见注解使用和自动装配

python-re模块学习-正则表达式

黑客攻击常用手段

正则表达式的规则

windwos::mutex

Spring中日志的使用（log4j）

Bootstra5 按钮处理

JVM内存结构-这一篇全部了解

Android的低级错误

Oracle中Cursor, A表a1字段值复制到B表b1字段

每日归档

更多

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)