转:相对清晰的一篇博客 从loss的l1,l2正则,追溯到模型复杂度衡量,追溯到不等式极值问题,以下两篇文章,可以进一步深入了解背后的数学原理
L1、L2正则化和过拟合 [从KKT条件下的拉格朗日乘法到拉格朗日对偶问题]