Python爬虫教程：开篇

从题目大家应该已经猜到了，小编要开始更新一个新的系列《零基础学 Python爬虫》，建议没有 Python 基础第一次接触的同学先看下小编之前更新的《零基础学Python3系列》，大致了解下 Python 的语法规则以及一些基础用法。学习需要循序渐进啊！每一个系列都是我的学习总结，学习分享，至于我是在哪里学的捏！每次文末下方，我们的学习圈，欢迎大家，付出都是会有收获的！希望大家也要加油哟！

先自己吹一波水，这个系列小编计划做成长期更新系列，目前 Python 爬虫涉及到的第三方的类库有些多，还会有很多有关 web 编程方面的基础知识，因面向的群体主要是小白，这些内容都需要一一介绍，这会是一个大的系列。额，远超之前的 Python 基础。

什么是爬虫？

不管是作为程序员还是小白，对爬虫这个词应该都不陌生，毕竟最近也发生了很多事情，很多人因为某些事情都进去了，具体情况我就不提了，容易被和谐。

在正式内容开始之前，提醒各位读者敬畏法律，热爱生活。

老规矩，先百度一波看看百度释义：

网络爬虫（又称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

讲点接地气的就是我们把平时使用的网络看成是一张大蜘蛛网，每个站点看做是这张网上面的一个一个的节点，爬虫好比是一只蜘蛛，在这张网上面按照一定的或者已经设计好的路线，找到目标节点获取所需资源。

为什么使用爬虫

平时我们在上网的时候，看到一些感兴趣的网络资源，可以使用复制黏贴的方式将这些资源下载回来，比如看知乎的时候，一些回答很精彩的高赞回答，数据量小的时候，我们动动鼠标右键也就搞定了，但是如果这种数据量非常大，有时候可以大到超出你的想像，再用鼠标右键复制黏贴就有些捉襟见肘了。

这时，我们就需要勤劳的爬虫出马了，爬虫这种“生物”，可以全天候24小时候不间断工作，只需提供必要的网络和电力，就可以一直勤劳的工作下去，让你解放双手，再也无需人工使用 CV 大法了。

可以看出，爬虫非常适合帮我们做两类事情：

大量数据的提取，在一定规则条件下。
完全自动化，无需人工过多干预。

想像一下，当老板让你搜索某类信息时，写一只勤劳的小爬虫，自己在旁边泡上一杯清茶，拿起手机开始愉快的玩耍，时不时的看这只爬虫有没有完成工作，这场景一下让我想起了万恶的资本家压榨劳动力。

小结

本篇文章为各位同学介绍了爬虫的基本概念，让大家对爬虫有一个大致的了解，以便后续章节的学习。开胃菜吃完了，下一节我们就要开始吃大餐了哟，你准备好了吗？

对Python感兴趣或者是正在学习的小伙伴，可以加入我们的Python学习扣qun：855408893 ，从0基础的python脚本到web开发、爬虫、django、数据挖掘数据分析等，0基础到项目实战的资料都有整理。送给每一位python的小伙伴！每晚分享一些学习的方法和需要注意的小细节，学习路线规划，利用编程赚外快。点击加入我们的 python学习圈

工程师大胖

发布了116 篇原创文章 · 获赞 18 · 访问量 2万+

私信关注