Beautiful Soup库——HTML/XML页面解析 - 代码天地

Beautiful Soup库——HTML/XML页面解析

编程语言 2020-02-10 21:04:46 阅读次数: 0

一、Beautiful Soup库的安装和导入

	————Beautiful Soup库是解析、遍历、维护“标签树”的功能库

安装：
Win平台: “以管理员身份运行”cmd 执行pip install beautifulsoup4
模块导入
Beautiful Soup库，也叫beautifulsoup4 或bs4
约定引用方式如下，即主要是用BeautifulSoup类


from bs4 import BeautifulSoup 引入bs4库的BeautifulSoup类功能模块

import bs4		引入整个bs4库

二、BeautifulSoup类解析基本原理

在这里插入图片描述
通过解析器，解析HTML/XML的标签树，从而取得想要的信息。
解析器：

三、BeautifulSoup类的基本元素

在这里插入图片描述

四、基于bs4库的HTML内容遍历方法（调用方式：soup.标签.属性）

在这里插入图片描述

标签树的下行遍历

在这里插入图片描述

遍历儿子节点
for	child in soup.body.children:
	print(child)
	
遍历子孙节点
for	child in soup.body.descendants:
	print(child)

标签树的上行遍历

在这里插入图片描述

注意：
在这里插入图片描述
3.标签树的平行遍历

注意：

五、基于bs4库的HTML格式输出

bs4库的prettify()方法（调用方式：soup.prettify()）
bs4库的编码

六、bs4库提供的查找方法

<>.find_all(name,attrs,recursive, string, **kwargs)

name : 对标签名称的检索字符串
attrs: 对标签属性值的检索字符串，可标注属性检索
如: id="", class=""
recursive: 是否对子孙全部检索，默认True
string: <>…</>中字符串区域的检索字符串
返回一个列表类型，存储查找的结果

注意:因为查找函数较常用，故:
在这里插入图片描述

发布了17 篇原创文章 · 获赞 0 · 访问量 310

私信关注

猜你喜欢

转载自blog.csdn.net/L_xiao_jie/article/details/104253806

Beautiful Soup库——HTML/XML页面解析

Beautiful Soup 解析html表格

使用Beautiful Soup解析库

python Beautiful Soup解析html页面table标签

爬虫2解析HTML页面-第三方库Beautiful Soup

Python中解析 html 使用Beautiful Soup库

Beautiful Soup

Beautiful Soup库整理

Beautiful Soup库的学习

Beautiful Soup库笔记

Beautiful Soup库介绍

Beautiful Soup库的安装

Beautiful Soup 库的应用

Beautiful Soup库

Beautiful Soup库入门

Beautiful Soup库详解

Beautiful Soup库的概述

使用Beautiful Soup解析html文件

beautiful soup解析html获得数据

Python之Html解析方法(beautiful soup)

HTML文档解析之Beautiful Soup

Beautiful Soup解析库的安装和使用

Class 14 - 2 解析库 -- Beautiful Soup

Python 爬虫解析库的使用 --- Beautiful Soup

解析库之Beautiful Soup（二）

解析库之Beautiful Soup（一）

爬虫之解析库beautiful soup

python 解析库Beautiful Soup的安装

【爬虫解析5】Beautiful Soup

Beautiful Soup解析工具简介

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)