大数据分析的四步过程模型

大数据这个词近些年非常火,其实在很多年前大家就开始利用大数据的一些方法和过程了。

耳熟能详的“决策支持系统”,“应急预案系统”,“舆情监测系统”等等,早在2005年前后就如雨后春笋般冒出来了。

我还记得当年参与了一个“舆情监测系统”的建设。

因为当时各个软件系统各自为政,所以甲方找了三四家一起来做这个系统。

其中包括了“基础信息采集”、“爬虫”、“展现”等。

在这里我还是要推荐下我自己建的大数据学习交流qq裙: 957205962, 裙 里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据开发相关的),包括我自己整理的一份2018最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深入大数据的小伙伴

我当时参与的部分就是将分析处理的结果在地图上进行展现,算是其中很小的一个模块。

最近听了Coursera的一个关于Data Analystics的课程,其中将大数据分析的过程分成四个步骤。

而翻阅了一些相关的书籍和资料发现不论是《大数据分析》的6步过程模型,还是其他文章提到的5个阶段,归纳起来都是这四个步骤。

因为Coursera上介绍的这四个步骤更加清晰,所以今天和大家分享的也是四个步骤的版本。

1

发现

从应用目标出发,确定所需的数据。

这里面包括定义问题,找出干系人的期望和顾虑;提出假设“可能会发生什么事情?”;收集数据并进行一些处理和分析。

问题的定义非常重要。

我们都知道,如果方向错了,那么做得再多不仅会事倍功半,甚至会产生负面的效果。

一家公司一直在委派一些专业机构进行招聘、绩效评估等方面的工作。

但是一直合作的专业机构的熟悉环境的接口人员岗位变动了,新来的人员对这个公司的很多东西不熟悉,造成了最近几个月的招聘工作进展不顺利。

有人会觉得这个问题就是提供人力资源服务的公司的问题。

但是这个是真正的问题吗?

会不会是公司一直没有能够开发自己的人力资源管理能力,这才是真正的问题呢?

以前在做决策支持相关功能和系统的时候,发现很多时候用户描述的问题都是表象。

大部分会集中在沟通效率低,工作效率低,成本不断上升。

但是根本的问题到底在哪里?

这是需要我们去进行挖掘的,不能简单的把用户给你的信息当做金科玉律。

因为很多时候用户也不知道根本的问题是什么。

立场不同,角度不同,对问题的描述都会不同。

2

分析

对数据进行处理和建模,看看这些数据如何来支撑之前的假设。

我们经常听说的自我学习体系,也是在这个过程中建立的。

在《大数据分析》以及其他一些书籍中,对于这个部分会讲述的比较详细。

包括算法、建模、模型优化和分析等等。

3

解释

根据上一步的分析结果对过去进行解释,并对未来进行预测。

将分析结果与一些财务、运营指标进行关联,用以支撑决策。

对于下一步的行动给出建议和评价。

在这里我还是要推荐下我自己建的大数据学习交流qq裙: 957205962, 裙 里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据开发相关的),包括我自己整理的一份2018最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深入大数据的小伙伴

这个步骤其实挺有意思的。

要知道同一份数据,可以根据不同的目的有不同的解释。

桌子上放了半杯水,你可以说,只剩下半杯就没有了。

你也可以说,看,桌子上还有半杯水呢!

数据是死的,就看你怎么看,怎么用了。

所以说,不管是大数据还是小数据,对于决策都是辅助的。

真正做解释和决策的其实还是人。

4

输出

根据解释和建议,制定详细的步骤或者路线图,并且提交给相关关系人。

对照业务目标,跟踪实施的效果。

以上介绍了关于大数据分析的四个步骤,不知道作为大数据产品经理的小伙伴有什么相关信息可以分享下~

猜你喜欢

转载自blog.csdn.net/cbyacq798/article/details/85244233