CS229学习笔记(0)

CS229_0

监督学习(Supervised Learning)

首先我们通过一些例子来讨论监督学习问题吧。假设我们有如下数据集:

image_1c5ku755b2p55h61qr41ibsjo9.png-24kB

我们可以将上述数据集绘制成如下图所示:

image_1c5kud0vc23rigi1ggh7de12h8m.png-20.8kB

那么我们如何根据这些数据集预测其他房屋的价格呢?

为了今后更好地学习,以上例为例,我们将房屋面积定义为输入变量 x(i) ,其亦称为特征变量;将房屋价格定义为输出变量 y(i) ,其亦称为目标变量; (x(i),y(i)) 表示一个训练实例,其中上标 i 表示第 i 个训练实例;集合 {(x(i),y(i));i=1,,m} 表示训练集,其中 m 表示训练集的大小。

当然,我们也可使用 χ 表示输入变量空间, Y 表示输出变量空间。在房屋价格此例中, χ=Y=R

在监督学习问题中,我们对给定的数据集,学习到一个函数 h:χY , 该函数 h(x) 能够很好地预测目标变量。通常,我们将该函数 h(x) 称为假设函数(Hypothesis Function),其处理流程如下图所示:

image_1c5l1vsq3omh17vn19tuugk6lu13.png-19.1kB

当输出变量为连续值时,我们将其问题称为回归问题(Regression Problem);当输出变量为离散值时,我们将其问题称为分类问题(Classification Problem)。

猜你喜欢

转载自blog.csdn.net/u013058162/article/details/79271627