Beautiful Soup库的简单使用 - 代码天地

Beautiful Soup库的简单使用

其他 2020-03-28 23:14:03 阅读次数: 0

一、BeautifulSoup库的简单使用

import requests
r=requests.get("http://python123.io/ws/demo.html")
demo=r.text
from bs4 import BeautifulSoup  #导入BeautifulSoup库
soup=BeautifulSoup(demo,"html.parser")  #使用html.parser进行解析
print(soup.prettify())  #打印解析结果

BeautifulSoup对应一个HTML/XML文档的全部内容

BeautifulSoup===标签树===BeautifulSoup类

二、BeautifulSoup标签的简单使用

使用下述.name，.attrs等访问名称，属性等：

基于bs4库的HTML内容遍历方法：

简单代码：

import requests
r=requests.get("http://python123.io/ws/demo.html")
demo=r.text
from bs4 import BeautifulSoup  #导入BeautifulSoup库
soup=BeautifulSoup(demo,"html.parser")  #使用html.parser进行解析
print(soup.title)  #若有多个类似标签，仅返回第一个
print(soup.a)
print(soup.a.name)   #返回名字
print(soup.a.parent.name)

tag=soup.a
print(tag.attrs)   #属性
print(tag.attrs['class'])
print(tag.string)   #两个尖括号之间的内容
print(type(tag.string))

print(soup.head)
print(soup.head.contents)   #contents返回其儿子

print(soup.title.parent)  #返回父节点

三、基于bs4库的HTML内容查找方法

如：

soup.find_all(string='Basic Python')
soup.find_all(id=re.compile('link'))   #正则表达式的模糊查询

扩展方法：

LY_624

发布了462 篇原创文章 · 获赞 55 · 访问量 32万+

私信关注

猜你喜欢

转载自blog.csdn.net/LY_624/article/details/105149023

Beautiful Soup库的简单使用

使用Beautiful Soup解析库

Beautiful Soup库整理

Beautiful Soup库的学习

Beautiful Soup库笔记

Beautiful Soup库介绍

Beautiful Soup库的安装

Beautiful Soup 库的应用

Beautiful Soup库

Beautiful Soup库入门

Beautiful Soup库详解

Beautiful Soup库的概述

Beautiful Soup 的使用

使用Beautiful Soup

Beautiful Soup 的使用问题

Beautiful Soup模块的使用

Beautiful Soup的使用

Beautiful Soup的使用（一）

Beautiful Soup解析库的安装和使用

Python 爬虫解析库的使用 --- Beautiful Soup

Python爬虫库-Beautiful Soup的使用

Python爬虫入门——Beautiful Soup库的使用

Beautiful Soup

Python Beautiful Soup模块的使用

20181223 python 使用Beautiful Soup

Beautiful soup的使用方法

对Beautiful Soup使用的小小总结

Python中解析 html 使用Beautiful Soup库

Python爬虫之Beautiful Soup解析库的使用（五）

Python爬虫学习（二）使用Beautiful Soup库

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)