BeautifulSoup的简单用法 - 代码天地

BeautifulSoup的简单用法

其他 2019-08-15 23:38:06 阅读次数: 0

官方文档加载比较慢(估计是我党的原因)

https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html#find-parents-find-parent

1、下载BeautifulSoup4

2、导入模块

from bs4 import BeautifulSoup

3、使用BeautifulSoup获取标签中的text

from bs4 import BeautifulSoup
s1 = """
<p class="ql-align-justify"> 在纪录表上，火箭少女中包括孟美岐、吴宣仪、杨超越、段奥娟、Yamy、赖美云、张紫宁及李紫婷，在身高、体重的字段上都有至少一项的数据，不过除了赖美云之外，其他像孟美岐、吴宣仪等人的身高都比官方公布的数字矮1到3厘米，像杨超越官方数字是168厘米，但实际身高是166.5厘米。</p>
"""
bs = BeautifulSoup(s1, "html.parser")
print(bs.text)

目的：从HTML文件提取文本

4、作用：去除指定的标签，目的：富文本框防止XSS攻击

from bs4 import BeautifulSoup
    bs = BeautifulSoup(s1, "html.parser")
    ret = bs.text
    # print(ret)
    ret = bs.find_all()
    print(ret)
    for tag in bs.find_all():
        print(tag.name)
        if tag.name == "script":
            tag.decompose()

猜你喜欢

转载自www.cnblogs.com/wt7018/p/11361183.html

BeautifulSoup的简单用法

python爬虫之BeautifulSoup4库的简单用法

Django简单用法

ldconfig 的简单用法

merge的简单用法

numpy 简单用法

cookie 简单用法

NSScanner简单用法

git 简单用法

Valgrind简单用法

Git简单用法

Jackson的简单用法

Handler 简单用法

markdown简单用法

JSON简单用法

CountDownLatch的简单用法

ListView简单用法

hgsvn简单用法

autotools的简单用法

map的简单用法

gcc的简单用法

awk简单用法

grep简单用法

Jackson简单用法

Jmeter的简单用法

bitset简单用法

fragment 的简单用法

HttpURLConnection的简单用法

GreenDao的简单用法

Volley的简单用法

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)