Beautiful Soup库的概述

Beautiful Soup库

Beautiful Soup提供一些简单的python式的函数用来处理:导航、搜索、修改、分析树等功能

它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所有不需要多少代码就可以写出一个完整的应用程序

Beautiful Soup是python的一个库,最主要的功能是:从网页获取数据

beautifulsoup4==4.7.1第四版本,简称bs4

学习Beautiful Soup库的目的

可以增加一种获取数据的方法

在正则表达式、XPath的基础上再增加一个bs4

安装Beautiful Soup库

pip install beautifulsoup4

Beautiful Soup支持的解析器

在这里插入图片描述
主要用前面两种解析器比较多,但主要的还是用第二种(lxml HTML解析器)
如果用第二种解析器,那么需要额外安装lxml库
命令:pip install lxml

发布了9 篇原创文章 · 获赞 0 · 访问量 4248

猜你喜欢

转载自blog.csdn.net/ytraister/article/details/104829341
今日推荐