大数据应用-数据挖掘(人工智能&机器学习&深度学习)

一、简述

Def.数据挖掘:从大量的数据中挖掘那些令人 感兴趣的 、 隐含的 、先前未知的和可能有用的模式或知识。

数据挖掘与传统数据库查询的区别:传统的数据库查询方法是查询出符合条件的记录;数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识,因此数据挖掘所得到的信息应具有先前未知、有效和可实用三个特征。先前未知是指信息是预先未曾预料到的,即:数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。

二、数据挖掘的任务:

1.分类预测型任务:利用一些已知变量来预测未知的或其他变量将来的值。典型的方法是 回归分析,即:利用大量的历史数据,以时间为变量建立线性(最小二乘法)或非线性(BP神经网络)回归方程。 在预测时,只要输入任意的时间值,通过回归方程就可求出该时间的状态。

2.描述型任务:找出人们可以解释,并能够描述数据的模式。描述性任务主要包括:
聚类:把没有预定义类别的数据划分成几个合理的类别。
摘要:摘要任务用于形成数据高度浓缩的子

猜你喜欢

转载自blog.csdn.net/qq_40521068/article/details/127390388