python安装BeautifulSoup库解析HTML页面

 BeautifulSoup三大特点:

  1. BeautifulSoup提供了一些简单的方法和Pythonic成语,用于浏览,搜索和修改解析树:一个解剖文档并提取所需内容的工具包。编写应用程序并不需要太多代码
  2. BeautifulSoup自动将传入文档转换为Unicode和传出文档为UTF-8。您不必考虑编码,除非文档未指定编码,而美丽汤不能检测到编码。然后您只需指定原始编码。
  3. Beautiful Soup位于流行的Python解析器(如lxmlhtml5lib)之上,允许您尝试不同的解析策略或交易速度以获得灵活性

下载链接: https://share.weiyun.com/5f6ZawU (密码:fODC)

安装BeautifulSoup:

分以下几步:

  1.解压BeautifulSoup的安装包到python的安装目录,如下图

2.在cmd中cd到BeautifulSoup的安装目录输入python  setup.py install 回车会出现如下图的加载:

这个时候就证明安装成功了,还有最后一步。

3.进入python->Lib->site-packages将bs4文件夹复制到Lib文件夹下

将python安装目录下的Tools->scripts->2to3.py文件复制到Lib下,这一步同上

最后在cmd中cd到lib目录,然后写入python 2to3.py bs4 -w如下图即可:

在eclipse上就可以正常的导入BeautifulSoup库了

猜你喜欢

转载自www.cnblogs.com/liuduanwu/p/9226928.html