吴恩达 机器学习 日记(一)

监督学习

· 监督学习 : 指我们给学习算法一个数据集。这个数据集由“正确答案”组成。

· 回归 : 用来预测一系列的连续值属性

举例1、房价预测

以面积为横坐标,房价为纵坐标,确定若干个坐标点。
我们将这些点看作连续的(Continuous),所以可以画出回归线,但不唯一,可以为回归直线或回归曲线等等。
房价预测

· 分类 : 预测离散的输出值

举例2、乳腺癌预测

以肿瘤的大小的特征为横坐标,是否为恶性肿瘤为纵坐标,确定若干点。
我们将这些点看作是离散的(discrete)。
乳腺癌预测
乳腺癌的判断标准不只是肿瘤的大小,还可能包括年龄、肿块的厚度,大小是否均匀一致,形状是否均匀一致等等。可以有无限个特征,然后用算法去解决。
多特征

举例3:

鉴于房地产市场上的房屋规模数据,尝试预测其价格。价格作为大小函数是连续输出,所以这是一个回归问题。
我们可以把这个例子变成一个分类问题,相反,使我们的输出的房子"卖得比要价多或少"。在这里,我们将基于价格的房屋分类为两个离散类别。

举例4:

(a) 回归 - 鉴于一个人的照片,我们必须根据给定的图片预测他们的年龄
(b) 分类 - 鉴于患者有肿瘤,我们必须预测肿瘤是恶性还是良性。

猜你喜欢

转载自blog.csdn.net/Red_Elf/article/details/104933352