随着大数据时代的来临,数据的价值也越来越大,因此如何获取网络上的数据也是许多程序员的必备知识之一。本人作为某上市公司爬虫组的一员,有过一定的爬虫经验,将简单介绍一下爬虫以及爬虫常用到的一些相关技术,希望对大家有所帮助。
本 Chat 的主要包括以下几个方面:
- 什么是爬虫
- 爬虫的主要分类(静态页面、动态页面等)
- Python 进行爬虫常用的一些工具(数据的请求、数据的解析、数据的存储等方面)
- 实战练习:静态页面、动态页面各一个
后续会继续推出并发、IP 代理池以及移动端更深层次的爬虫技术,望持续关注。
阅读全文: http://gitbook.cn/gitchat/activity/5cf52d61cf8672351cd26880
一场场看太麻烦?成为 GitChat 会员,畅享 1000+ 场 Chat !点击查看