数据分析之我见(1)-方法论

请关注

微信公共账号:数据夜谈

一个数据人互相分享的小圈子!

 

摘要:

数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。这是比较技术的定义,更偏向于分析本身。但数据分析更应该作为一种解决问题的方法论,指导和影响我们的工作,更有甚者,它可以引领未来。

正文:

作者:王鹏(沙咖)
 
数据分析大家很容易想到数理统计、图表、分析报告,但这只是分析的手段和结果的展现形式。数据分析其实是发现问题、分析问题和解决问题的过程。数据分析引领未来的这一面,本文不再赘述,这是数据分析人员修养能力,不是数据本身的问题。
在整个公司业务的各个环节,问题无处不在,如何发现问题,理解问题需要很深的商业头脑、业务理解。懂业务,了解商业是数据分析的核心,各种分析的方法论、分析技能只是解决商业问题的手段,所以数据分析能否做好,发现问题是最重要的,也通常是一些数据分析师忽略的。
发现问题首先要明确是哪个业务环节产生了问题,问题对整个业务有哪些影响,解决这些问题对整个业务的意义;其次,对这些问题进行归类和拆分,把问题拆分得越细,对问题理解也就越深,分析的效果也就越好,问题拆分的过程能够提供分析解决问题的方向;最后,根据拆分后的问题,列出数据需求清单(数据来源、数据口径、调研报告等等),作为发现问题和分析问题承上启下的重要一环,数据准备越充分,分析效果也自然越好。
分析问题可以粗略分为几步:1.数据收集;2.数据处理;3.数据分析。首先,根据数据需求清单,收集和整理相关的数据,日志、业务数据、调研报告等等,现在数据过载的时代,找到数据相对比较容易;其次,对这些数据进行加工处理,数据仓库是比较完美的数据处理方案,但也是成本最高的,有可借助的数据仓库最好,没有的话自己处理也不是很困难,这个过程其实就是数据到信息的过程,验证数据的可行性、数据清洗、数据的结构化、数据的口径归一;最后,利用处理好的数据,结合拆分的问题,确定分析的维度、指标和采用的分析技术和方法论,一层一层的分析问题即可。这几步结束后,基本上针对问题也会产生几个解决方案。
那么 解决问题就是通过一些手段把这些解决方案输出,要么是图标报告,要么是决策支持,要么是一些数据分析的应用或产品。目的要么是解决现有问题,要么是找到未来的问题。
 
罗列一些数据分析的方法,结合上面说的和下面的方法,希望帮你引出自己的数据分析方法论。

发现问题的五种方法:
问题树:通过把一个核心问题拆分成一个个可操作的小问题。1.提供一个解决问题的整体框架,反应解决问题的完整度;2.小问题更具可操作性,优先级也便于识别,进而找到相应的责任人;3.各个问题之间的关系更明晰,上下游的影响比较可控,在团队合作方面便于达成共识。
鱼骨图:又称因果图。鱼头为核心问题,鱼刺是问题的关键要素。把影响问题的各个要素以鱼骨图的形式呈现,可以1.从整体上审视各个局部因素,直观识别问题和原因的关系;2.从各个侧面研究问题,确定优先级,保留关键要素、剔除非关键要素。
关键路径:对具有流程性的问题特别适合。找到问题的各个流程中的关键路径,这些路径的哪些点使问题扩大化、哪些点对问题的影响极小、哪些点是必不可少,但没有问题解决的空间。识别路径的现状,找到解决问题的突破口。
价值树:对可量化的问题特别适合。找到问题对应的关键指标,然后找到影响这个指标的业务点或者子问题和其对应的指标,反复迭代,最后找到叶子指标对应的问题,从这些问题去解决问题,一层一层往上解决就是了。
多因素评分法:对不可量化的问题特别适合。找到问题的几个主要因素,每个因素按标准评出一个相应的分数,然后根据待评工作总分确定相应的等级。

分析的方法
趋势+分布+对比分析:首先,从时间序列分析随时间的变化趋势,找出其规律;其次,通过集中趋势分析或离散趋势分析,看看数据的整体分布,了解业务数据是否稳定以及数据的集中度;最后,通过对比分析,看看数据的分布和稳定性在同期是否有变化,相关关系有多大。
异常分析:又称孤立点分析,孤立点可能是脏数据,也可能是与实际对应有意义的事件。从大量历史数据中找出太高、太低、变化幅度过大等异常情况数据,支持预警显示、预警提醒;并可进一步进行相关影响原因的数据挖掘
排名分析:从大量数据中找出按某种分类方法的Top N数据,这些数据代表了需要特别关注的程度
相关分析:研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度,分为单相关、复相关、偏相关
结构分析:在统计分组的基础上,计算各组成部分所占比重,进而分析某一总体现象的内部结构特征、总体的性质、总体内部结构变化规律的分析方法
预测分析:利用决策树、回归分析、神经网络、时间序列等数据挖掘算法对客户响应、流失预警、收入预测、业务量预测等进行预测分析
 
还有很多发现问题、分析问题的方法与其对应的数理统计、数据挖掘等技能,这里不再赘述。本文只是想起到抛砖引玉的作用,大家一起探讨数据分析如何解决业务问题。
接下来结合领域和行业,看看怎么玩数据分析。
 
 

猜你喜欢

转载自hugh-wangp.iteye.com/blog/2030658