吴恩达机器学习笔记（二）

第二章单变量线性回归

模型描述

房价预测的例子：

这是一个房价预测的例子，同时也是一个一元线性回归问题（单变量线性回归）。

房价预测之所以是监督学习的例子是因为每一个样本都有一个正确的答案。

正式的定义：在监督学习里，设有一个数据集，这被称为一个训练集。

符号定义：

m表示训练样本的数量，

x表示输入变量（或者特征），

y表示输出变量（预测的目标变量），

（x，y）表示一个训练样本，

（x^（i），y^（i））表示第i个训练样本（i指的是索引，表示第i个训练样本）。

监督学习算法的工作流程：

在房价预测的例子中，提供一个训练集，学习算法的任务是输出一个函数，通常用h表示。

h表示假设函数，作用是把房子的大小作为输入变量，房子的价格作为输出变量，h是一个引导从x得到y的函数。

对于假设h我们可以用一条直线描述，用线性函数预测房价值：

代价函数

对上述的公式来说，我们要做的是如何选择θ0和θ1，选择不同的参数将得到不同的假设和假设函数。

表示关于θ0和θ1的最小化过程，这意味着我们要找到θ0和θ1的值来使这个表达式的值最小，即把问题变成：找到能使训练集中预测值和真实值的差的平方的和的1/2m最小的θ0和θ1的值，这将是线性回归的整体目标函数。

定义代价函数：

通过对求J（θ0，θ1）最小值来满足需求。

这就是代价函数，也被称为平方误差函数，有时称为平方误差代价函数，平方误差代价函数是解决回归问题最常用的手段。

代价函数的例子：

（1）将θ0设为0，此时学习算法的优化目标是通过θ1选择获得最小的J（θ1），minimizeJ（θ1）就是线性回归的目标函数，最小化J（θ1）来找到一条最符合数据的直线。

（2）将θ0和θ1都考虑进来，得到一个3D曲面图如下：

横轴为θ0和θ1，若改变参数的值，会得到不同的J（θ0，θ1）。竖轴为曲面的高度，就是J（θ0，θ1）的值。这个类似碗的形状就是代价函数的形状。使用等高线图或称为等高图像展示这些曲面，通过这些图像，更好地理解代价函数J的意义，如何对应不同的假设函数以及接近代价函数J最小值的点，对应着更好的假设函数，同样，我们真正想要的是一个高效的算法自动寻找代价函数J的最小值对应的θ0和θ1。