Beautiful Soup 常用方法 - 代码天地

Beautiful Soup 常用方法

其他 2018-07-12 18:27:44 阅读次数: 0

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库

初始化

from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc)

查找
find_all( name , attrs , recursive , text , **kwargs )
soup.find_all(‘title’, limit=1)等价于soup.find(‘title’)
name 参数可以查找所有名字为 name 的tag
通过 text 参数可以搜搜文档中的字符串内容
attrs 搜索tag的属性
limit 截取
Beautiful Soup会检索当前tag的所有子孙节点,如果只想搜索tag的直接子节点,可以使用参数 recursive=False .

soup.find_all('b')
soup.find_all(id='link2')
soup.find_all(re.compile("^b"))
soup.find_all(["a", "b"])
soup.find_all(True)

获取内容
如果只想得到tag中包含的文本内容,那么可以嗲用 get_text() 方法,这个方法获取到tag中包含的所有文版内容包括子孙tag中的内容,并将结果作为Unicode字符串返回:

soup = BeautifulSoup(markup)
soup.get_text()
link.get('href')

猜你喜欢

转载自blog.csdn.net/lkjasdgfh/article/details/80432264

Beautiful Soup 常用方法

Beautiful soup的使用方法

Beautiful Soup

Beautiful Soup 基本使用方法

爬虫Beautiful Soup方法选择器

Beautiful Soup 4 方法便捷查询

Python之Html解析方法(beautiful soup)

Beautiful Soup之方法选择器

Beautiful Soup学习笔记(对我自己比较常用)

Beautiful Soup初步

Beautiful Soup (一）

Beautiful Soup 的使用

Beautiful Soup的用法

使用Beautiful Soup

Beautiful Soup 的使用问题

Python爬虫--Beautiful Soup

Beautiful Soup模块详解

Beautiful Soup库整理

Beautiful Soup库的学习

Beautiful Soup库笔记

Beautiful Soup模块的使用

Beautiful Soup库介绍

Beautiful Soup的使用

Beautiful Soup 4.4.0 文档

Beautiful Soup库的安装

Beautiful Soup 库的应用

Beautiful Soup的安装

Beautiful Soup 4.2.0 文档

7.01-beautiful_soup

Beautiful Soup的使用（一）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)