数据挖掘 绪论 笔记(一)

在这里插入图片描述
数据挖掘的主要内容

1.数据分类和数据聚类的概念如何区别?

  • 分类:是把不同的事物,进行区分,把其中属于一类的物品划分在一起

  • 聚类:是在不同的事物中,相似度非常接近的物品划分在一起

其实我的理解就是:无论是分类还是聚类,你去给予一个东西属性的时候,你都要去做比较,分类则是与给定的已有规则或者模型作比较,聚类则是不制定规则,而是在他们之间作比较,将比较相似的东西放在一起,从而达到目的。这也是监督学习和非监督学习的区别,因为监督学习我们会给训练集(答案),而后者没有训练,测试一说(我这么说就很理解了吧hh)


2.数据、信息、知识的概念如何区分?

  • 数据:单纯的数字、数值、符号、文字等。185,72是数据。(符号而已)

  • 信息:有用的数据。身高185,体重144。 (其实就是相关联的数据组成集合)

  • 知识:有用的信息,通过分析知识得出的结论。某某大学学术实力很强 (有用信息组成的集合,可以用于分析)


3.科学发展范式包括哪四个阶段?

  • 第一阶段:经验科学 before-1600年

  • 第二阶段:理论科学1600-1950年

  • 第三阶段:计算科学1950-1990年

  • 第四阶段:数据科学1990-现在


おすすめ

転載: blog.csdn.net/m0_45311187/article/details/121343001