机器学习入门笔记(二)----线性回归

1. 目标 : 找到使代价函数最小的函数h。

2. 代价函数：cost function，J。

3. 梯度下降法：将代价函数J取值最小化。

4. 多元线性回归：

5. 特征缩放：

6. 实用技巧：

7. 多项式回归：

的二次函数可以拟合，但是主观判断下，二次函数会随着面积增加，最终下降，如蓝线。这是不符合预期的。

选取sqrt(x)特征的多项式，图像可以拟合数据且更合适。

8. 线性回归的另一个求解方法: 方程求解法.

例如对于一个简单的一元代价函数:J = a θ^2 + bθ + c. 直接求导=0,即可解出使函数最小的解θ.

对于多元的代价函数,即 θ为n维向量的情况,可以分别对向量中的每个θ求偏导=0的解.组合起来,即是使J最小的解向量.

但是这种求解方法太麻烦,给出一个矩阵求解公式:

9. 关于梯度下降法与方程求解法的选择:

优缺点 :

1.梯度下降法需要选择步长a. 这是额外的工作量.

2.梯度下降法需要多次的迭代.

3.梯度下降法大概是O(n^2)复杂度,而方程法需要求解逆矩阵,约O(n^3)复杂度.

所以当n较小时,方程法是比较好的直接求解方法.当时n很大时,方程法将会很慢,梯度下降法会更为合适.

这个界限很难界定, 通常可能参考的特征数量为10000.

在以后将会学习到的其他问题中, 许多无法通过方程法直接求解, 所以梯度下降法将会是个后面常用的方法.

10. 在Octave中,使用pinv计算逆矩阵,而不是inv.因为pinv在矩阵不可逆的情况下,也会计算出一个值.不可逆的原因,可能是: