1.学习“享受运动”这一概念:
样例 | 天气 | 温度 | 湿度 | 风力 | 水温 | 预报 | 享受运动 |
1 | 晴 |
暖 | 普通 | 强 | 暖 | 一样 | 是 |
2 | 晴 | 暖 | 大 | 强 | 暖 | 一样 | 是 |
3 | 雨 | 冷 | 大 | 强 | 暖 | 变化 | 否 |
4 | 晴 | 暖 | 大 | 强 | 冷 | 变化 | 是 |
2.概念定义在实例集合之上,这个集合表示为X。(X:所有可能的日子,每个日子的值由天气、温度、湿度、风力、水温、预报六个属性表示)
3.待学习的概念或目标函数称为目标概念,记做c。当c(x)=1时,享受运动;当c(x)=0时,不享受运动。
x:每一个实例 X:样例,所有实例的集合
学习目标:f:X ->Y
训练集:用来进行训练,也就是产生模型或者算法的数据集 测试集:用来专门进行测试已经学习好的模型或者算法的数据集 验证集:用于调整参数
特征向量:属性的集合,通常用一个向量来表示,附属于一个实例
标记:c(x),实例类别的标记(正例,反例)
4.分类问题:目标标记为类别型数据
回归问题:目标标记为连续性数值
5.有监督学习:训练集有类别标记 无监督学习:训练集无类别标记 半监督学习:有类别标记的训练集+无类别标记的训练集