透彻理解正则化（Regularization） - 代码天地

透彻理解正则化（Regularization）

其他 2020-10-19 17:34:44 阅读次数: 0

先要理解损失函数可视化

针对参数空间内的损失函数等高线图，满足相同loss值的解有无穷多个。

损失函数添加正则项的一般形式：
$L=\sum_{i=1}^n[y_i-\sum_{j=1}^p(w_j*x_i)-b]+λ\sum_{j=1}^p|w_j|^q$

我们做出 $\sum_{j=1}^p|w_j|^q$ 在不同 $q$ 下的图像：

在损失函数可视化中我们画了损失函数 $\sum_{i=1}^n[y_i-\sum_{j=1}^p(w_i*x_i)-b]$ 的等高线形式，如果将不带正则项的损失函数图像和正则图像放在一起：

以左图最外圈来说，损失函数值达到最外圈所对应的值时，这样 $w_1$ 和 $w_2$ 有无穷多个，那么如果我们加了 $l_1$ 正则项，表示从这无穷多个中选择一个，这一个是这去穷多个中 $w_1+w_2$ 最小的一个。如果一条直线与多个等高线相交，那么这些交点处的 $w_1+w_2$ 都是相等的，此时选择等高线最小的解，如图中点5。

右图同理 $l_2$ 正则第一次与等高线相切的点对应的 $w_1$ 和 $w_2$ 是无穷多个解中 $w_1^2+w_2^2$ 最小的一个。

所以可以得到结论：等高线与正则项首次相交的地方就是最优解。正则项缩小了我们求解的参数空间范围。

https://blog.csdn.net/zandaoguang/article/details/107970123
http://freemind.pluskid.org/machine-learning/sparsity-and-some-basics-of-l1-regularization/#ed61992b37932e208ae114be75e42a3e6dc34cb3http://

从贝叶斯角度深入理解正则化
——一定要看

为什么不用L0作为正则项？
从理论来说，L0确实是求稀疏解的最好的正则项，但是机器学习中特征的维度往往很大，你也可以理解为系数很多很多，然后解L0又是个NP-hard问题，因此在实际工程应用中极有限制，不可行。

为啥我们非得得到稀疏解呢？
这个问题并不绝对。从统计上来说，稀疏解可以舒缓模型的过拟合问题，毕竟可以使模型复杂度降低了——即让一部分属性失效了。

猜你喜欢

转载自blog.csdn.net/weixin_38052918/article/details/107814978

透彻理解正则化（Regularization）

正则化(Regularization)

正则化（regularization）

【ML】正则化 Regularization

Regularization（正则化）与Dropout

正则化 regularization

正则化（Regularization）本质

Regularization(正则化)

Regularization：正则化

Regularization 正则化

入理解深度学习——正则化（Regularization）：多任务学习

深入理解深度学习——正则化（Regularization）：稀疏表示

深入理解深度学习——正则化（Regularization）：正则化和欠约束问题

Dropout Regularization（丢弃正则化）

机器学习--正则化(Regularization)

深入理解深度学习——正则化（Regularization）：半监督学习

深入理解深度学习——正则化（Regularization）：Bagging和其他集成方法

深入理解深度学习——正则化（Regularization）：数据集增强

深入理解深度学习——正则化（Regularization）：参数绑定和参数共享

入理解深度学习——正则化（Regularization）：提前终止（Early Stopping）

深入理解深度学习——正则化（Regularization）：噪声鲁棒性

深入理解深度学习——正则化（Regularization）：作为约束的范数惩罚

谱范数正则（Spectral Norm Regularization）的理解

机器学习之正则化（Regularization）

Tikhonov regularization 吉洪诺夫正则化

线性回归和正则化（Regularization）

【深度学习笔记】正则化（Regularization）

机器学习中的正则化（Regularization）

机器学习笔记4：正则化（Regularization）

机器学习笔记——正则化（regularization）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)