大数据分析中的挖掘技术(二)

版权声明:系CDA数据分析师原创作品,转载需授权 https://blog.csdn.net/yoggieCDA/article/details/85612121


我们在上一篇文章中给大家介绍了大数据分析技术、数据挖掘的意义、数据挖掘的技术以及方法还有机器学习的内容。一般来说,大数据分析中的挖掘技术都是比较重要的,在这篇文章中我们给大家介绍一下数据挖掘的主要过程以及数据挖掘的重点内容。

我们不只在一篇文章中提到过,数据挖掘的内容是非常重要的,数据挖掘主要过程就是根据分析挖掘目标,从数据库中把数据提取出来,然后经过ETL组织成适合分析挖掘算法使用宽表,然后利用数据挖掘软件进行挖掘。传统的数据挖掘软件,一般只能支持在单机上进行小规模数据处理,受此限制传统数据分析挖掘一般会采用抽样方式来减少数据分析规模。这样我们才能够做好数据挖掘工作。

而数据挖掘的计算复杂度和灵活度远远超过前两类需求。一是由于数据挖掘问题开放性,导致数据挖掘会涉及大量衍生变量计算,衍生变量多变导致数据预处理计算复杂性;二是很多数据挖掘算法本身就比较复杂,计算量就很大,特别是大量机器学习算法,都是迭代计算,需要通过多次迭代来求最优解。根据这米多的需求就可以说明数据挖掘工作是多么的重要。

在数据挖掘工作中,我们需要重点注意这几个地方,分别是可视化分析、数据挖掘算法、预测性分析、语义引擎、数据质量和数据管理的知识。下面我们一个一个的为大家解答一下这个问题。首先就是可视化分析。数据可视化无论对于普通用户或是数据分析专家,都是最基本的功能。数据图像化可以让数据自己说话,让用户直观的感受到结果。其次就是数据挖掘算法。图像化是将机器语言翻译给人看,而数据挖掘就是机器的母语。分割、集群、孤立点分析还有各种各样五花八门的算法让我们精炼数据,挖掘价值。然后就是预测性分析。预测性分析可以让分析师根据图像化分析和数据挖掘的结果做出一些前瞻性判断。接着说说语义引擎。语义引擎需要设计到有足够的人工智能以足以从数据中主动地提取信息。最后说说数据质量和数据管理。数据质量与管理是管理的最佳实践,透过标准化流程和机器对数据进行处理可以确保获得一个预设质量的分析结果。

以上的内容就是小编为大家介绍的相关大数据分析中的数据挖掘技术的相关知识了,想必这些内容能够给大家带来帮助,最后感谢大家的阅读。

猜你喜欢

转载自blog.csdn.net/yoggieCDA/article/details/85612121