大数据挖掘初识

近年来,大数据挖掘这个词越来越多的出现在人们的生活中。而这里面的大数据,并非只是数据量很大,还表示数据维度多,数据复杂度高,数据来源广泛。

当前,数据挖掘针对的数据有结构化、半结构化及无结构化的数据,在目标数据挖掘中,需要将不同类别不同来源的数据融合并交叉验证,最终得到一份涵盖充分且高质量的数据,助于人们的分析及决策。

大数据可以从三个方面刻画,(1)量级,volume,大量的数据;(2)速率,velocity,高速的数据产出;(3)多样性,variety,多种类型和来源的数据。由于大数据往往混合结构、半结构和无结构化的数据,难以管理、处理和管理。

在挖掘中,以2-3种数据源开始,比如网站数据、消费者数据及CRM等,从中得到一些有用的结论,然后增加数据源来辅助和加深分析。

猜你喜欢

转载自y-x.iteye.com/blog/2077763