关于数据挖掘与数据分析的区别和联系,我在网上搜集了一些,自己挑选了几种形象利于理解的答案
简单罗列如下:
(1)
从实际工作角度:数据分析更侧重业务,数据挖掘则更侧重技术
数据分析强调基于新的发现支持业务决策,关键是要转换到业务行动中发挥数据价值;
数据挖掘关注焦点在于技术创新而非业务含义,当业务问题转化为数据问题后,建模工作主要是寻求可行的技术解决方案,过程中业务人员起的是辅助作用。另外,数据挖掘从实验室完成模型孵化,到模型管理、部署,都是严谨的工程化过程。
此外,他还提到,银行传统的风控评分建模,更多的工作在于分析,而非挖掘。
来自知乎Magic的回答:https://www.zhihu.com/question/20127962
(2)
数据科学这个词是在英文世界中诞生的,不妨从英文语义的角度看。
数据挖掘(data mining):是一个跨学科的计算机科学分支。它是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程。其总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。除了原始分析步骤,它还涉及到数据库和数据管理方面、数据预处理、模型与推断方面考量、兴趣度度量、复杂度的考虑,以及发现结构、可视化及在线更新等后续处理。数据挖掘是“数据库知识发现(KDD)”的分析步骤。
数据分析(data analysis):是一个检查、清理、转换和建模数据的过程,目的是发现有用的信息,得出结论和推动决策制定。数据分析具有多个方面和多种方法,包括各种名称下的多种技术,不同的商业,科学和社会科学领域。
以上是维基百科中对数据挖掘和数据分析的定义。
可以看到,提及数据挖掘时,一般指的都是利用人工智能、机器学习、统计学和数据库知识方法应用于较大型数据集,是“knowledge discovery in database ”的一个步骤,本质是一种计算过程,目的是发现知识规则(discovering patterns)
提及数据分析时,一般包含检查、清理、转换和建模的过程,本质是人的智能活动的结果,目的是发现有用的信息、建设性结论以及辅助决策。
来自知乎YUANFANG的回答:https://www.zhihu.com/question/20127962
(3)
举个形象的例子。
我们去院看病的时候,通常医生会先对你进行一番“望闻问切”,开一堆检查让我们去做。拿到检查结果后,医生诊断是xx问题,这个是就是数据分析,医生心里是有假设的,这一堆检查是为了验证他的假设。
医生不仅要看病,他自己还要学习,要写论文,去完善自己对某些身体特征和疾病之间关系的理解,这个就是数据挖掘和建模。
来自知乎Elodie Chen的回答:https://www.zhihu.com/question/20127962