人力资源员工离职原因数据分析

本项目的数据集来源kaggle竞赛项目:HR-Analytics,自行下载即可!

1.提出问题

公司当中员工们离职的原因是什么?
什么样的员工会离职呢?

2.读取数据,理解数据

导入数据分析工具包,这次我们用seaborn库来优化我们的数据可视化图表!
在这里插入图片描述
读取数据
在这里插入图片描述
查看数据,head()方法没有指定默认查看前5行
在这里插入图片描述
查看数据是否存在缺失值以及数据类型
在这里插入图片描述
查看数据集是否有异常值
在这里插入图片描述
综上:本数据集有10个特征,8个数值特征,2个类别特征,共有14999条数据,都没有缺失,也没有发现异常值。

先备份数据,以免破坏源数据。

在这里插入图片描述
如果有需要,可以修改列名,方便分析
在这里插入图片描述
将离职这一列移动到最前面方便我们对于离职原因进行分析(其实不移动也行【捂脸】,就当知识点学习吧!)
在这里插入图片描述
3.数据探索
我们利用seaborn来可视化相关系数
在这里插入图片描述
在这里插入图片描述
通过这个图我们可以清楚的识别哪两个特征之间相关性高,这给我们指引了一个分析的方向。

数据观察:

-项目数、平均月工作时间和绩效评估,项目数和月平均工作时间有一定的正相关关系;

-离职和满意度,离职和工作事故有一定负相关关系。

粗略的看一下数据中满意度-工龄这5个特征与离职之间的关系
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
观察数据:

(1)离职和满意度之间的关系:

-满意度低于0.2的员工离职人数达到峰值,说明这部分员工因对公司不满意而离开了公司

-满意度在0.4左右和0.8左右离职人数达到峰值,说明这部风员工对公司很满意,离职可能是找到了更好的工作机会
(2)离职和绩效评估之间的关系:

-绩效评估低于0.6的员工离职人数达到峰值,说明这部分员工因表现不佳离开公司

-绩效评估在0.8-1之间员工离职人数达到峰值,说明这部分员工表现很好,离开公司可能是找得到了好的工作机会
(3)离职和项目数之间的关系:

-项目数为2的员工离职人数最多,说明不努力完成项目的员工大多离职

-项目数为4-7的员工也有离职,尤其完成项目数为7的员工竟然全部离职,说明完成项目太多,因过度劳累离职
(4)离职与平均月工作时间之间的关系:

-平均月工作时间在150小时左右的离职员工达到一个峰值,说明这部分员工因工作量少,工作时间短离职

-平均月工作时间在250-300小时的离职员工达到一个峰值,说明这部分员工因工作量多,工作时间长离职
(5)离职与工龄之间的关系:

-工龄在4年以内的员工离职人数较多

-工龄在7-10年的全部没有离职,说明工龄较长的员工比较稳定

详细的数据探索:
分析升职情况与离职之间的关系
在这里插入图片描述
观察数据:

在职员工的升职人数比较多,离职员工的升职人数很少,这说明有部分员工因得不到公司重用而离职。

分析所属部门与离职情况之间的关系
在这里插入图片描述
这样我们看不出什么,我们最好计算它的离职率并做成饼图来看
在这里插入图片描述
在这里插入图片描述
观察数据:

(1)公司各部门离职率相差不大;

(2)人力资源管理部和财务部门离职率相对较高;

(3)管理层、技术、研发部门离职率相对较低,是否跟薪资水平与有关?

分析薪资水平与离职情况之间的关系
在这里插入图片描述
观察数据:

(1)薪资水平高,离职人数少;

(2)薪资水平低,离职人数多。

分析工作事故与离职情况的关系

在这里插入图片描述
观察数据:
在离职人群中有工作事故的出现,说明有些员工的离职跟工作事故有关。

分析满意度与薪资水平之间的关系
在这里插入图片描述
观察数据:

薪资越高,员工对公司的满意度越高。

分析项目数、月平均工作时间、与离职之间的关系
在这里插入图片描述
观察数据:

(1)随着项目数量的增加,员工的平均月工作时间也随之增加;

(2)项目数量相同时,离职员工的平均月工作时间比在职员工多。

分析项目数、绩效评估与离职之间的关系

在这里插入图片描述
观察数据:

(1)随着项目数的增加,员工的绩效评估平均值也随之增加;

(2)项目数大于2个,相同项目数,离职员工的绩效评估比在职员工的绩效评估分数高。

分析所属部门、绩效评估与离职之间的关系

在这里插入图片描述
观察数据:

(1)财务部、人力资源部、市场部离职员工的平均绩效评估均远低于在职员工,说明这些部门离职员工绩效;

(2)其他部门离职人员的绩效评估平均值高于在职员工,我们推测这部分员工离职是因为找到了更好的工作机会。

综合分析

在这里插入图片描述
观察数据:

(1)离职集群1:平均月工作时间在150左右,绩效评估低于0.58,这部分离职员工因不努力工作离职;

(2)离职集群2:平均月工作时间在250-300之间,绩效评估高于0.8,这部分离职员工因劳累过度或者找到了更好的工作机会而离职;

(3)在职集群:平均月工作时间在150-280之间的员工比较稳定。

在这里插入图片描述
观察数据:

(1)离职集群1:满意度低于0.2而绩效却高于0.75离职的员工,说明这部分员工离职是因为工作很努力但是对自己的工作并不满意而离职;

(2)离职集群2:满意度在0.4左右,绩效在0.6以下,说明这部分员工对公司不满意不努力工作而离职;

(3)离职集群3:满意度在0.8以上,绩效也在0.8以上离职的员工,可能找到了更好的工作机会而离职。

到这里就结束啦,如有那些地方不妥,还请大家指正!

猜你喜欢

转载自blog.csdn.net/hl_zmfh/article/details/83150783