一些常用的python库

python一些第三方库的作用:

1.requests库
requests库是一个简洁且简单的处理HTTP请求的第三方库,从服务器获取数据。通过调用requests库,帮我们搞定爬虫第1步——获取数据。
Request包含:请求头、请求体等 。如果服务器能正常响应,则会得到一个Response,Response包含:html,json,图片,视频等
它的最大优点是程序编写过程更接近正常URL访问过程。这个库建立在Python语言的urllib3库的基础上,类似在其他函数库之上再封装功能
Request模块缺陷:不能执行JS 和CSS 代码

2.beautifulsoup4库
beautifulsoup4库,也称为Beautiful Soup 库或bs4库,用于解析和处理HTML和XML(解析和提取网页中的数据)。通过这个模块, 我们可以把从服务器获取到的数据,“翻译”成程序能读懂代码,我们才能通过程序提取到想要的数据,这就是【解析数据】。【提取数据】是指把我们需要的数据从源数据中有针对性地挑选出来。
beautifulsoup4 库将专业的Web页面格式解析部分封装成函数,提供了若干有用且便捷的处理函数。
需要注意的是,它不是BeautifulSoup库。它的最大优点是能根据HTML和XML语法建立解析树,进而高效解析其中的内容。

3.sys
sys提供python解释器系统的通用配置和函数,影响着解释器的行为。注意这里的系统不是操作系统,而是python解释器这个“系统”。

  • sys.version (python版本而非os版本)
  • sys.path (模块搜索路径,不是os的环境变量)
  • sys.getrecursionlimit (最大嵌套调用层数)
  • sys.getrefcount (获取对象的引用计数)

Guess you like

Origin blog.csdn.net/a123789999/article/details/117460903