一个动力密集型产业的预算的数据分析建模过程

对于一个劳动力密集型产业来说,做预算判断未来的财月的运营成本,往往可以简化成下面这个公式:

成本= 员工数目 * 人均开销


其中人均开销包括薪资,培训费用和办公费用,这个些费用往往比较固定或者易于计算,可以视为定量.

于是,剩下的变量就是员工数目又叫HeadCount. 预测成本的关键就在于预测员工数目.

员工数目取决于工作量,比如售后行业都会对员工的工作进展通过一个软件记录追踪, 所以就能获得历史上同期员工的劳动时间(Labour Hours),比如一个月有22个工作日,这个月售后服务一共需要2200工时,那么所需要的员工数量大概就是2200/(8*22)=12.5约等于13人.

但在实际情况下员工不可能把8个小时的上班时间全部用满, 他们会有会议,有培训还有休闲的时间. 这就引出一个效率值的概念.比如根据统计一个员工某天花了5个小时工作,那么他的效率值就是5/8. 于是计算员工数的公式如下:

员工数 = 该月需要的工时/(8*工作日数目*效率值)

根据这个公式,如果我们确定了"该月需要的工时"和"效率值", 那么员工数就能确定, 进而确定成本,完成预算.

这里来说说怎么使用数据分析的方法来确认效率值. 首先要明确需要什么样的因素来预测每个月的效率值,我使用的因素包括:

几月, 这个月工作日数, 这个月是否有春节的假期, 这个月有多少用户的服务合约到期.

一般用户在服务合同到期前总会想办法突击消费掉这个服务合同剩余的服务时间,由此产生的服务请求往往比较简单,对效率值有影响.

确定了这几个因素后我们来说说用R语言怎么去预测效率值. 

首先在处理大量数据之前,可以运用聚类算法(或人为区分),对数据惊醒粗线条的划分,然后对每个聚类得到的子集进行预测, 这是一个小窍门. 比如软件公司售后业务可以分为云服务售后和传统软件售后, 预测预算的时候因为各国的人力成本不同, 可以分开预测.

猜你喜欢

转载自blog.csdn.net/rav009/article/details/69767549