一、数据分析方法论
(一)数据分析方法论,是用来指导数据分析师进行一次完整的数据分析的宏观思路。(管理方面的理论模型有PEST分析法、5W2H分析法、时间管理、生命周期、金字塔、SMART原则等;营销方面的理论模型有4P营销理论、用户行为理论、STP理论、SWOT理论等)
作用:理清思路,分解问题显示关系,为后续分析指导方向,确保数据分析的有效和正确。
(二)以下是几个经典理论
1、PEST分析法,主要用于宏观环境的分析:
2、5W2H分析法:这是个可以弥补疏漏,并且富有启发性的方法。例如了解用户购买行为,可以在该方法的指导下整理用户行为的相关数据,建立用户购买的分析框架。
3、逻辑树分析法:通过子问题的罗列理清思路,将工作细分为便于操作的任务。缺点:涉及的问题可能有遗漏。例如:
4、4p营销理论:四个基本策略的组合,即产品(Product)、价格(Price)、渠道(Place)、宣传(Promotion),例如了解公司的整体运营情况,该方法可作为指导。
5、用户行为理论:用户使用行为是指用户为获取使用物品或服务所采取的各种行动,用户对产品首先需要有一个认知熟悉的过程,然后试用,再决定是否继续消费使用,最后成为忠实用户。
认知过程:认知→熟悉→试用→使用→忠诚。例如:
二、数据分析方法
数据分析方法,则是指具体的分析方法。以下只是一些基本的数据分析方法。如下图做细分类:
数据分析作用 | 基本方法 | 数据分析方法 |
---|---|---|
现状分析 | 对比 | 对比分析、平均分析、综合评价分析... |
原因分析 | 细分 | 分组分析、结构分析、交叉分析、杜邦分析、 漏斗图分析、矩阵关联分析、聚类分析... |
预测分析 | 预测 | 回归分析、时间序列、 决策树、神经网络... |
(一)对比分析法: 静态比较(横比)、动态比较(纵比)。包括与目标对比(完成率),不同时期对比(同比、环比等),同级部门、单位、地区对比,行业内对比,活动效果对比。
(二)平均分析法:平均指标有算数、几何、调和、平方平均数等,中位数、众数。主要作用:对比同类现象在不同地区、行业的差异程度;对比某些现象在不同历史时期的变化,说明发展趋势与规律。
(三)综合评价分析:分析对象越复杂,越需要将多个指标转换为一个能够反映综合情况的指标来评价,主要有五个步骤:①确定分析指标。②收集数据,进行标准化处理(下面只涉及0-1标准化)。③确定各个指标的权重(只涉及目标优化矩阵)。④对处理后的指标,计算出综合评价分值。⑤根据分值排序,得出结论。
数据标准化的处理方法:
0-1标准化,将数据作线性变换,使结果落到[0,1]区间内。公式:
第N个经标准化处理的值=(第N个原始值-最小值)/(最大值-最小值)
权重确定方法:目标优化矩阵法。
(四)分组分析法:目的是便于对比,将有不同性质的对象区分开,性质相同的对象保留在一起;涉及的概念:组数,组距,组限,上限、下限,组中值(它是一组变量的代表值),等距分组与不等距分组。
步骤:①确定组数,太多会分散,太少会过于集中;②确定组距,可以考虑等距分组;③将数据归入组内。
(五)结构分析法:属相对指标,指总体内各部分所占的比例。计算公式:
结构相对指标(比例)=(总体某部分的数值/总体总量)×100%
例如:市场占有率=(某种商品销售量/该种商品市场销售总量)× 100%
(六)交叉分析法:分析两个及以上变量(字段)间的关系,同时将两个有一定联系的变量以及值交叉排列在一张表格内,使变量值成为不同变量的交叉结点(也叫交叉表分析法)例如:不同地区各个水果的销售量如下表
地区 | 苹果 | 香蕉 | 雪梨 | 行小计 |
---|---|---|---|---|
A | 73 | 64 | 72 | 209 |
B |
70 | 63 | 56 | 189 |
C | 69 | 48 | 68 | 185 |
列小计 | 212 | 175 | 196 | 583 |
容易了解:不同地区的水果销量(行小计);不同水果的地区销量(列小计);各个地区的水果销量(节点值)。
(七)杜邦分析法:是一种用来评价公司赢利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。
(八)漏斗图分析法:对于周期长、流程规范、环节多的业务,通过漏斗图可以很快发现业务流程中出现问题环节,例如:
引用大佬文章:Excel-漏斗图分析
(九)矩阵关联分析(象限图分析法):以事物的(一般两个)属性为分析依据,构成四个象限。在解决问题和资源分配时,为决策者提供参考。
第一象限,应该给予支持,用户的满意度与认为的重要性成比例。
第二象限,优先改进,满意度低,但用户认为重要性高。
第三象限,无关紧要,重要性低,满意度低。
第四象限,优势保持,满意度高,但重要性低,可以考虑将资源适当投入给第二象限的生产中。
其他矩阵举例: