线性代数——最小二乘法和投影矩阵

最小二乘法是统计学中重要的概念,这篇文章将讲解它拟合曲线的性质以及它与投影矩阵的联系

拿最小二乘法拟合直线来举例

将误差的平方和作为总误差,总误差最小时可求得最佳拟合直线

若设y为ax+b,分别对a和b求导,因为这种函数大多为凹函数,所以取偏导为0时有极值,这里不再展开。

这种求误差方式是从一维图像上求向量模的最小值,但我们可从高纬度来审视这种方法,先把y-yi列出来

ax1+b=y1-e1

ax2+b=y2-e2

ax3+b=y3-e3

ax4+b=y4-e4

行列式?那我们可以把它转换成矩阵

这不就是Ax=b吗,更准确的说y1,y2,y3,y4是我们的拟合对象,e1,e2,e3,e4是误差,这个公式是Ax=b-e

若Ax=b有解则e=0,此时的x就是我们所需的答案,但往往数据集要远超变量的数目,b在列空间之外,我们没法通过空间内的向量去拟合空间外的向量,所以我们要去拟合最接近b的向量,如果拿二维平面(列空间)和三位向量(b)来举例,最接近b的向量就是b在平面上的投影,此时e^2最小,它就是点到平面的最短距离的平方。

现在假设Ax-b垂直于列空间展开的平面,即Ax-b在A的零空间中,故AT(Ax-b)=0

ATAx=Ab—>x=Ab*(ATA)^-1

此时x中的系数即为最佳拟合系数,这种矩阵算法给计算机提供了一个快速计算系数的方法

猜你喜欢

转载自www.cnblogs.com/matrixmlpforever/p/10963240.html