Scrapy 2.0.0 发布,Python 爬虫框架

Scrapy 2.0.0 发布了。Scrapy 是一套基于 Twisted 的异步处理框架,纯 Python 实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片。

此版本主要更新亮点包括:

  • 不再支持 Python 2
  • 部分协程语法支持和实验性异步支持
  • 新的 Response.follow_all 方法
  • FTP 对媒体管道的支持
  • 新的 Response.certificate 属性
  • 通过 DNS_RESOLVER 的 IPv6 支持

更新说明: https://github.com/scrapy/scrapy/releases/tag/2.0.0

猜你喜欢

转载自www.oschina.net/news/113832/scrapy-2-0-0-released