拉勾网招聘数据分析

关于如何爬取拉勾网上的招聘信息,网上教程很多,而且很详细,我自己不再重复提供了。

每个人遇到的大部分问题,我估计70%,在网上都可以找到答案。善于利用搜索引擎,自己多动手,就能够解决其中的大部分问题。

我感兴趣的是,如何处理爬下来的数据,这些数据能够描述什么样的现状。当然了,仅仅展示这些数据,对于数据分析来说是远远不够的。展示是第一步,是基础。如何从这些展示的数据中发现问题,并提出解决方法,甚至能够说服领导或者业务人员,按照你的方法去改进,才是对数据分析人员的挑战。


爬取下来的原始数据,格式如下:


分析工具:jupyter notebook,比较直观,界面友好。用到的库主要是pandas、matplotlib、jieba、wordcloud

一、学历的要求

本科学历以绝对优势遥遥领先。有点意外的是,大专学历比例也不低。硕士需求就比较少。

我个人理解,python最近几年火起来,主要得益于大数据分析和挖掘。而数据挖掘对个人能力要求高,比较厉害的人才基本被头部公司抢走。剩下的大部分公司,主要招的是web开发,python web开发的需求量很大。

能力强一点的硕士,基本不会跑到小公司去做web开发,差一点的硕士,薪资要求也会比本科生高,而且不一定愿意加班。而本科学历的人,相比较而言,年轻一些,也知道自己的起点不是很高,愿意加班。刚开始工作的时候,加加班,迅速掌握一些技术,对于他们来说,不管是以后辞职找其他工作还是在内部晋升都是有帮助的。

这些年轻人,有学习能力(能考上本科,学习能力不会很差),薪资比硕士要求低,而且愿意加班,用人单位当然更喜欢。

二、工作经验

工作3~5年的人,在市场上更受欢迎;工作1~3年的人,市场需求也不少。

如果能做一些相关性的分析,比如3~5年的要求,主要是在那些行业,从事什么样的岗位,参考意义会更大。


三、不同城市对python工作岗位需求

北京、深圳、上海提供了市场上74%的工作岗位,侧面也反应了,为什么大家都往北深上跑,因为机会多啊。


四、招聘职位中那些关键字出现得最多

出现最多的词频是开发,紧随其后的是高级和资深,数据分析的需求可以说很少了。 词频中还有“东莞”,哈哈。

猜你喜欢

转载自blog.csdn.net/songrenqing/article/details/80540956