周志华《机器学习》笔记(一)绪论

第一章 绪论

1、数据集(data set):机器学习数据的集合;

2、示例/样本(instance/sample):每条数据描述了一个对象的信息,该对象称之为示例,一般用x表示;

3、属性(attribute):数据描述的样本在某些方面的性质;

4、样本空间(sample space):样本张成的空间,又称“属性空间”或者“输入空间”;

5、假设(hypothesis):学得模型对应了数据集中某种潜在的规律;

6、真相/真实(ground-truth):数据集本身的潜在的规律。学习的过程是逼近真相的过程;

7、标记(label):有关示例结果的信息,一般用y表示;

8、样例(example):具有标记信息的示例;

9、标记空间//输出空间(label space):所有标记的集合构成的空间;

10、分类(classification):一种典型的学习任务,将数据集按一定规律分为若干类;(监督学习)

11、二分类(binary classification):将数据集分为两类;

12、回归(regression):一种典型的学习任务,预测数据集对应的结果;(监督学习)

13、聚类(clustering):无监督学习的一种,将训练集的数据分为若干组,每组称为一个‘簇’,且每个组的情况事先并不知道。

14、泛化能力(generalization):学得模型适用于新样本的能力;

15、期望:在概率与统计学中是指每次可能结果的概率乘以其结果的总和,反映随机变量平均值大小。

16、归纳偏好

奥卡姆刀(Occam's razor):若有多个假设与观察一致,则选择最简单的那个。

没有免费午餐定理(No Free Lunch Theorem  NFL):无论设计一种的算法如何聪明,另一种算法如何笨拙,他们的期望性相同。因此要谈论算法的相对优劣,必须要针对具体的学习问题。

猜你喜欢

转载自www.cnblogs.com/xkchi/p/10649037.html
今日推荐