机器学习之正规方程法

正规方程法是用来求解最优回归系数θ的,,其公式为:

\theta = (X^{T}X)^{-1}X^{T}y

注意我们应该给X添加一个X_{0}特征,常把它设置为一,并添加一个\Theta_{0}系数

  • 如下图所示:

如果矩阵X'X结果是不可逆的

 

通常有两种最常见的原因

 

第一个原因是 如果不知何故 在你的学习问题

 

你有多余的功能

 

例如 在预测住房价格时

 

如果x1是以英尺为尺寸规格计算的房子

 

x2是以平方米为尺寸规格计算的房子

 

同时 你也知道1米等于3.28英尺 ( 四舍五入到两位小数 )

 

这样 你的这两个特征值将始终满足约束

 

x1等于x2倍的3.28平方

 

并且你可以将这过程显示出来 讲到这里 可能 或许对你来说有点难了

 

但如果你在线性代数上非常熟练

 

实际上 你可以用这样的一个线性方程 来展示那两个相关联的特征值

矩阵X'X将是不可逆的

 

第二个原因是 在你想用大量的特征值

 

尝试实践你的学习算法的时候

 

可能会导致矩阵X'X的结果是不可逆的

 

具体地说 在m小于或等于n的时候

 

例如 有m等于10个的训练样本

 

也有n等于100的特征数量

 

要找到适合的 ( n +1 ) 维参数矢量θ 这是第 n+1 维

 

这将会变成一个101维的矢量

 

尝试从10个训练样本中找到满足101个参数的值

 

这工作可能会让你花上一阵子时间

 

但这并不总是一个好主意

 

因为 正如我们所看到 你只有10个样本 以适应这100或101个参数

如何选择使用随机梯度下降还是正规方程法求最优回归系数呢?

如何一个样本的特征少于10000个那么选用正规方程法,否则使用随机梯度下降

二者的优缺点比较:

猜你喜欢

转载自blog.csdn.net/qq_41482837/article/details/81623979
今日推荐