吴恩达机器学习笔记（十）

第十一章应用机器学习的建议

决定下一步做什么

当要设计机器学习系统时，如何选择一条最适合最高效的道路？

假设你已经实现了正则化的线性回归来预测房屋价格，然而，当在一组新的测试集上使用该假设时，在预测上出现了不能接受的错误，接下来会做什么呢？也就是说当调试学习算法时，当面对测试集算法效果不佳时，会怎么做呢？

（1）采集更多的训练样本；（有时候并没有效果）

（2）尝试选用更少的特征；

（3）尝试获取更多的特征；

（4）尝试增加特征多项式；

（5）尝试减小或增大正则化参数的值。

由此引出机器学习诊断法：这是一种测试法，通过执行这种测试能够了解算法在哪里出了问题，也能告诉你要想改进一种算法的效果，什么样的尝试才是有意义的，这些诊断法的执行与实现需要花很多时间来理解和实现。

评估假设

在这一节中将介绍怎么评价算法学习得到的假设。

为了确保可以评价假设函数，需要将训练集分成两部分，第一部分成为训练集，第二部分成为测试集。

典型按照7:3比例，如下：

1）训练和测试线性回归的步骤：

1. 对训练集进行学习得到参数θ（具体来说就是最小化训练误差）。

2. 计算出测试误差：

这是线性回归时测试误差的定义。

2）训练和测试线性回归的步骤：

1. 从训练数据中学习得到参数θ。

2. 计算出测试误差：

3. 错误分类（0/1分类错误）

模型选择、训练、验证、测试集

对于过拟合问题，在过拟合中的学习算法即便对训练集拟合的很好，也并不代表它是一个很好的假设。通常来说，这就是为什么训练集误差不能用来判断该假设对新样本的拟合好坏；具体来讲，如果用这些参数来拟合训练集，就算假设在训练集上表现地很好，也并不意味着该假设对训练集中没有的新样本有多好的泛化能力。更为普遍的规律，如果参数对某个数据集拟合的很好（比如训练集或者其他数据集），那么用同一数据集计算得到的误差（比如训练误差）并不能很好地估计出实际的泛化误差，即该假设对新样本的泛化能力。

（1）模型选择问题

在多项式回归时，该如何选择次数作为假设模型呢？

如何从这些模型中选出最好的一个，应该看哪个模型有最小的测试误差。

假设对这个例子，选择五次多项式模型，看一看这个模型的泛化能力怎么样，可以观察这个五项式对测试集的拟合情况，但问题是这样仍然不能公平地评估出这个假设的泛化能力。原因：拟合了一个额外的参数d，也就是多项式的次数，用测试集拟合了参数d，选择了一个能最好地拟合测试集的参数d的值，因此，参数向量θ5在测试集上的性能很可能是对泛化误差过于乐观的估计。

所以为了解决模型选择出现的问题，通常会采用下面的方法来评估假设：

给定一个数据集，把它分成三个部分：训练集、交叉验证集、测试集，它们的比例为3:1:1，用交叉验证集来作为评判选择的标准，选择合适的模型，而测试集则是作为算法性能的评判。