网络爬虫的第一个库--BeautifulSoup - 代码天地

网络爬虫的第一个库--BeautifulSoup

其他 2021-03-23 14:09:22 阅读次数: 0

用到的参考文章：https://blog.csdn.net/kikaylee/article/details/56841789。

1.安装

BS安装多数在linux系统下安装教程多，无奈我的实在windows系统下使用的，所以也摸索了一段时间。参考此文章:https://blog.csdn.net/u012175089/article/details/60987804.先将下载好的.gz的安装包放在Scripts文件夹下，然后在做相应的操作，下载好之后安装如下（我也不知道为什么是安装在那个路径，因为我电脑同时有3.7和3.1两个版本的python，默认是3.7，我用3.1安装是不是就安装在默认路径，没有考究）：

测试一下是否安装成功

from bs4 import BeautifulSoup
from urllib.request import urlopen
resp = urlopen("http://www.baidu.com")
html=resp.read()
bs = BeautifulSoup(html)
print( bs.prettify())

一百度为例，最后输出来一大堆妖魔鬼怪啊，太长就不粘贴了，测试成功。

2.BeautifulSoup的基本用法

最权威的文档或者详细的使用发放可以参照官网的文档说明：https://www.crummy.com/software/BeautifulSoup。

2.1 多种解析方式

推荐使用第二种，在实际运用中，第二种效果够用了，当然是根据自身所需要的来装换。

2.2常用对象和方法

主要是包括beautifulsoup最常用的方法，如findall、select以及一些对象（如果对网页的html或者xml的构成熟悉的话，这些就显得很简单了），在下一篇章中，详细介绍各个方法的用法，以及复杂的正则表达式，结合起来就可以在网页中提取我们需要的饿元素或者资源。

猜你喜欢

转载自blog.csdn.net/ljsant/article/details/102483360

网络爬虫的第一个库--BeautifulSoup

网络爬虫入门：你的第一个爬虫项目（requests库）

初学python第一个网络爬虫

编写第一个网络爬虫

来！编写你的第一个网络爬虫

《用python写网络爬虫》编写第一个网络爬虫

第一个简单的爬虫

第一个爬虫

我的第一个爬虫

第一个scrapy爬虫

第一个爬虫测试

第一个爬虫与测试

第一个爬虫及测试

第一个Python爬虫

第一个爬虫脚本

第一个爬虫==

Python 第一个爬虫

第一个Pyspider 爬虫

python第一个爬虫

python 网络爬虫入门（一）———第一个python爬虫实例

《用Python写爬虫》学习笔记（二）编写第一个网络爬虫

JAVA爬虫--编写第一个网络爬虫程序

Python网络爬虫学习笔记——第一个爬虫程序

python 网络爬虫第一个python爬虫实例

使用beautifulsoup做一个简单的网络爬虫

爬虫笔记（一）——第一个爬虫

第一Python第一个爬虫项目

爬虫简单入门：第一个简单爬虫

Python爬虫之第一个爬虫

python爬虫1：第一个爬虫

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)