模型求解

监督学习的优化目标

这部分摘自:机器学习中的范数规则化之(一)L0、L1与L2范数

一般来说,监督学习可以看做最小化下面的目标函数:

       其中,第一项L(yi,f(xi;w)) 衡量我们的模型(分类或者回归)对第i个样本的预测值f(xi;w)和真实的标签yi之前的误差。因为我们的模型是要拟合我们的训练样本的嘛,所以我们要求这一项最小,也就是要求我们的模型尽量的拟合我们的训练数据。但正如上面说言,我们不仅要保证训练误差最小,我们更希望我们的模型测试误差小,所以我们需要加上第二项,也就是对参数w的规则化函数Ω(w)去约束我们的模型尽量的简单。

       机器学习的大部分带参模型都和这个不但形似,而且神似。是的,其实大部分无非就是变换这两项而已。对于第一项Loss函数,如果是Square loss,那就是最小二乘了;如果是Hinge Loss,那就是著名的SVM了;如果是exp-Loss,那就是牛逼的 Boosting了;如果是log-Loss,那就是Logistic Regression了;还有等等。不同的loss函数,具有不同的拟合特性,这个也得就具体问题具体分析的。   规则化函数Ω(w)也有很多种选择,一般是模型复杂度的单调递增函数,模型越复杂,规则化值就越大。比如,规则化项可以是模型参数向量的范数。然而,不同的选择对参数w的约束不同,取得的效果也不同,但我们在论文中常见的都聚集在:零范数、一范数、二范数、迹范数、Frobenius范数和核范数等等。
 

线性回归中,经典的方法是OLS(普通最小二乘),为了防止过拟合又有Ridge回归和LASSO回归,高维数据还有PLS、OPLS等。

概率模型中,有LSE(最小二乘估计),此外还有所谓的MLE(最大似然估计)。

OLS对应的是SE(平方误差,均方误差MSE乘以N)。

此处对这些方法进行总结。(未完待续……)

猜你喜欢

转载自blog.csdn.net/fjsd155/article/details/84400137
今日推荐