1.
1.1若预测离散值,此类学习任务称为“分类”;若预测连续值,此类学习任务称为“回归”;
1.2此外还可以进行“聚类”,即将训练集中的对象分成若干组,每组称为一个“簇”;这些自动形成的簇可能对应一些潜在的概念划分。
2.
2.1根据训练数据是否拥有标记信息,学习任务可大致划分为两大类:“监督学习”和“无监督学习”,分类和回归是前者的代表,聚类则是后者的代表。
2.2算法在学习过程中对某种类型假设的偏好,称为“归纳偏好”。
3.
人工智能的发展中必然产物-机器学习。
二十世纪八十年代,“从样例中学习”的一大主流是符号主义学习,其代表包括决策树和基于逻辑学习。
4.
典型的决策树学习以信息论为基础,以信息熵的最小化为目标,直接模拟了人类对概念进行判定的树形流程。
基于逻辑的学习的著名代表是归纳逻辑程序设计。可看作机器学习与逻辑程序设计的交叉,它使用一阶逻辑来进行知识表示,通过修改和扩充逻辑表达式来完成对数据的归纳。
5.
二十世纪九十年代中期之前,“从样例中学习”的另一个主流技术是基于神经网络的连接主义学习。
6.
二十世纪九十年代中期。“统计学习”开始风靡。代表性技术是支持向量机(Support Vector Machine, SVM)以及更一般的方法“核方法”。
7.
二十世纪初,连接主义学习又卷土重来,“深度学习”开始流行。因为计算能力的提高,大数据的发展。