周志华 机器学习 第一章绪论笔记

https://www.jianshu.com/u/df4c5558ec8a   周志华学习笔记专栏

https://github.com/PnYuan/Machine-Learning_ZhouZhihua  周志华学习github 

第一章绪论部分的专有名词解释

决策树:

归纳逻辑程序设计:可看作机器学习与逻辑程序设计的交叉,它使用一阶逻辑(即谓词逻辑)来进行知识表示,通过修改和扩充逻辑表达式(例如Prolog表达式)来完成对数据的归纳;

统计学习:SVM和kernel methods(核方法);

深度学习:深度学习?狭义地说就是"很多层"的神经网络,尤其是涉及语音、图像等复杂对象的应用中,深度学习技术取得了优越性能;

假设空间:机器学习中可能的函数构成的空间称为“假设空间”,监督学习(supervised learning)的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。模型属于由输入空间到输出空间的映射的集合,这个集合就是假设空间(hypothesis space)。假设空间的确定意味着学习范围的确定。

数据挖掘:数据挖掘是从海量数据中发掘知识,这就必然涉及对"海量数据"的管理和分析.大体来说,数据库领域的研究为数据挖掘提供数据管理技术,而机器学习和统计学的研究为数据挖掘提供数据分析技术.由于统计学界的研究成果通常需要经由机器学习研究来形成有效的学习算法,之后再进入数据挖掘领域,因此从这个意义上说,统计学主要是通过机器学习对数据挖掘发挥影响,而机器学习领域和数据库领域则是数据挖掘的两大支撑.

归纳偏好 :https://blog.csdn.net/zmdsjtu/article/details/52689895

迁移学习:

类比学习:

课后答案

本章概要

本章从如何挑选西瓜的经验出发,介绍了本书所涉及基本术语和概念

数据集、样本、特征(属性)、特征空间(属性空间、样本空间、输入空间)、特征向量、维数;

学习(训练)、训练数据、训练样本、假设、预测、标记、样例、标记空间(输出空间)、测试、测试样本;

分类、回归、聚类、簇、监督、无监督、泛化能力;

归纳、演绎、概念学习、假设空间、版本空间;

归纳偏好(偏好)、奥卡姆剃刀;

同时简要介绍了机器学习的发展史。

符号主义、连接主义、机器学习、数据挖掘、统计学;

习题解答

1.1 版本空间

这里写图片描述

当前的特征维度为3(色泽、根蒂、敲声),共3、2、2种取值,1,4的特征完全不同。

根据版本空间的定义(版本空间指的是与训练集一致的假设空间),由表可知,1,4样例各特征取值均不同,于是得出当前的版本空间为:

这里写图片描述


1.2 折合范式提升假设空间表示能力

这里写图片描述

首先给出相关定义,合取范式:Conjunctive normal form - Wikipedia,析合范式:Disjunctive normal form - Wikipedia

然后考虑问题。本题采用析合范式来提升假设空间,解答思路如下图:

这里写图片描述


1.3 噪声下的归纳偏好设计

这里写图片描述

  • 最简单的设计就是:训练样本一致特征越多越好(一致性比例越高越好)为归纳偏好。
  • 另外,考虑归纳偏好应尽量与问题相匹配,这里可使归纳偏好与噪声分布相匹配。

1.5 试述机器学习能在互联网搜索的哪曲环节起什么作用

https://blog.csdn.net/starzhou/article/details/51195040






猜你喜欢

转载自blog.csdn.net/weixin_39970417/article/details/80311544