python爬虫教程：bs4的使用 - 代码天地

python爬虫教程：bs4的使用

其他 2019-04-17 21:05:50 阅读次数: 0

bs4 的使用

bs4 就是Beautiful Soup 的简称，这是一个工具箱，通过解析文档为用户提供需要抓取的数据，
使用这个不需要在编码的上面考虑，他会自动转换为utf-8编码。
但是使用这个的前提的就是网页是完整的，但是现在的网页大多规范化，所以都是可以用的
官网： http://beautifulsoup.readthedocs.io/zh_CN/latest/
bs4 必须使用一种解析器，如果你没有安装其他的HTML解析器，他会默认使用自带的解析器，但是lxml 解析器更加强大，速度更快，推荐安装
对于四种解析器的对比

解析器	使用方法	优势	劣势
Python标准库	BeautifulSoup(markup, “html.parser”)	1. Python的内置标准库 2. 执行速度适中 3.文档容错能力强	Python 2.7.3 or 3.2.2)前的版本中文档容错能力差
lxml HTML 解析器	BeautifulSoup(markup, “lxml”)	1. 速度快 2.文档容错能力强	需要安装C语言库
lxml XML 解析器	BeautifulSoup(markup, [“lxml”, “xml”]) BeautifulSoup(markup, “xml”)	1. 速度快 2.唯一支持XML的解析器 3.需要安装C语言库
html5lib	BeautifulSoup(markup, “html5lib”)	1. 最好的容错性 2.以浏览器的方式解析文档 3.生成HTML5格式的文档 4.速度慢	不依赖外部扩展

想要学习Python？Python学习交流群：973783996满足你的需求，资料都已经上传群文件，可以自行下载！

对于bs4 有四大对象种类

Tag
navigableString
BeautifulSoup
Comment

更加细致的编写的方法，可以去官网查看

猜你喜欢

转载自blog.csdn.net/fei347795790/article/details/89256341

python爬虫教程：bs4的使用

Python爬虫(十五)_案例：使用bs4的爬虫

python爬虫基础知识——requests、bs4的使用

python 爬虫之beautifulsoup（bs4）使用

Python 爬虫 bs4 数据解析基本使用

python爬虫思路及BeautifulSoup bs4使用

爬虫_BS4

爬虫-BS4

Python爬虫之bs4库

Python爬虫bs4解析实战

python爬虫-bs4模块

python爬虫(十)-------------------bs4

初探python爬虫（五）——bs4

Python爬虫速成------bs4库

Python爬虫速成------bs4库

python爬虫8：bs4库

python爬虫---bs4 模块

beautifulsoup爬虫使用-bs4

python的-bs4

bs4的使用

bs4使用

bs4爬虫入门

request、bs4爬虫

python bs4 + requests4 简单爬虫

python接口自动化测试十七：使用bs4框架进行简单的爬虫

Python爬虫数据提取方式——使用bs4提取数据

python爬虫系列(3.7-使用 bs4 爬取获取贵州农产品)

python爬虫入门之————————————————第四节--使用bs4语法获取数据

python爬虫—使用bs4爬取链家网的房源信息

从零开始写Python爬虫 -1.2 BS4库的安装与使用

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)