机器学习(Andrew Ng)学习笔记

一、监督学习(Supervised Learning)

监督学习的定义:
给出一组数据集,数据集中每一个样本都有对应的正确的输出值。

上图是监督学习的最简单的例子之一:回归问题(regression problem)

使用一次函数或更高次的函数拟合房屋售价数据,训练数据中每一个样本都包含了该房子真实的售价,学习目标是预测某一面积(图中绿色的250)的房子的售价(图中蓝色的200K dollar)。

在回归问题中,输入数据与输出值都是连续(continual)的。

上图是另一个监督学习的例子:分类问题(classification problem)

在这个例子中,给出一组训练数据,其中每个样本包括肿瘤的大小、这个肿瘤是否是恶性的(该样本所属类别),使用这组训练数据训练一个学习模型,将某个肿瘤的大小输入到学习模型中,让它输出这个肿瘤是良性的还是恶性的。

在上图中,训练数据也可以这样表示:用不同类型的点(×、○等)代表不同类别的样本

如上图所示,在其他的分类问题中,训练数据往往有多种特征(如图中的病人的年龄、肿瘤大小)

在分类问题中,输出值是离散的,而且输出值可能不只是本例中0、1(良性、恶性)两种取值,往往可能有两个以上的取值。

课后习题:

问题1:目前已有同一种商品的大量库存,预测这种商品在未来三个月中的售出量

问题2:给出若干个个人账户的信息,判断每个账户是否已被入侵。

显然问题1是回归问题,问题2是分类问题。

猜你喜欢

转载自www.cnblogs.com/qpswwww/p/8934162.html