Scrapy+MongoDB 抓取豆瓣 Top250 入门爬虫进阶

初步入门 Python 网络爬虫的你,是否想要写一些看上去高大上的项目练练手呢?Request 还是 PyQuery,两者爬虫效率能不能达到预期?然而 Scrapy 这样强大的框架对你有点陌生,那么你一定不要错过本次 GitChat。

这一次 Chat 我想为大家带来 Scrapy+MongoDB 数据库存储,来抓取豆瓣电影 Top250,通过这样一个实战快速上手 Scrapy,本场 Chat 您将学到:

  1. MongoDB 安装以及环境配置;
  2. Scrapy 四大组件初探;
  3. Xpath 快速入门;
  4. 通过 Scrapy 抓取豆瓣点评排行榜 Top250;
  5. 抓取数据保存至 MongoDB 用作后期分析。

阅读全文: http://gitbook.cn/gitchat/activity/5c49b3c75e8cdb421b82b451

一场场看太麻烦?成为 GitChat 会员,畅享 1000+ 场 Chat !点击查看

猜你喜欢

转载自blog.csdn.net/valada/article/details/86684184