数据挖掘【1】概述(引言)

大家好,在之前的文章中,向大家介绍了区块链的相关内容,从今天起,我们将开启一个新的内容,数据挖掘。

 

数据科学可能是内容覆盖面最广、知识点跨度最大的综合性学科,在开始对它进行介绍前,我们先来了解一些理念:

education is the kindling of a flame not the filling of a vessel.——Socrates

苏格拉底说,教育是点燃火焰而不是灌输。希望我们的这个系列文章能够去启发大家的思想,而不仅仅是知识点的罗列。

A teacher who is attempting to teach without inspiring the pupil with a desire to learn is hammering on cold iron.——Horace Mann

霍伊斯·曼恩认为,没有激发起兴趣的学习就像铁锤锻打冷铁。而兴趣向来因人而异,如果本系列的行文不能激发你的兴趣,请尝试一切可能的方式,优先激发兴趣。

现在进入正题。

从2000年起,数据的存储能力急剧提升,并且逐渐从模拟到数字,同一时期,我们的计算能力也有了急剧的提升,正是这种存储能力与数据处理能力的提升为数据挖掘奠定了基础。

我们现在实际上是生活在一个数据的世界,不管你有没有意识到,我们每时每刻每分每秒都在和数据打交道。网站,期货,手机,传感器,银行卡,购物,体检等等等等,时刻产生着巨量的数据。

然而,Data Rich, Information Poor,数据很多,信息很少。据统计,仅有0.5%的数据是真正经过了分析和处理,剩余大量的数据静静的躺在数据中心,耗费着巨大的电能,并散发出巨大的热能。

由此不难得出两个结论,数据挖掘有着深刻的应用背景,数据挖掘有着广阔的应用前景。

猜你喜欢

转载自www.cnblogs.com/lenbor/p/12924021.html