深入理解深度学习——正则化（Regularization）：稀疏表示 - 代码天地

深入理解深度学习——正则化（Regularization）：稀疏表示

企业开发 2023-06-04 20:28:07 阅读次数: 0

分类目录：《深入理解深度学习》总目录

另一种策略是惩罚神经网络中的激活单元，稀疏化激活单元。这种策略间接地对模型参数施加了复杂惩罚。我们已经在《深入理解深度学习——正则化（Regularization）：参数范数惩罚》中讨论过 $L^1$ 惩罚如何诱导稀疏的参数，即许多参数为零（或接近于零）。另一方面，表示的稀疏描述了许多元素是零（或接近零）的表示。表示的正则化可以使用参数正则化中同种类型的机制实现。表示的范数惩罚正则化是通过向损失函数 $J$ 添加对表示的范数惩罚来实现的。我们将这个惩罚记作 $\Omega(h)$ 。和之前一样，我们将正则化后的损失函数记作 $\tilde{J}$ ：
$\tilde{J}(\theta; X, y) = J(\theta; X, y) + \alpha\Omega(h),$

其中 $\alpha\in[0, \infty]$ 权衡范数惩罚项的相对贡献，越大的 $\alpha$ 对应越多的正则化。正如对参数的 $L^1$ 惩罚诱导参数稀疏性，对表示元素的 $L^1$ 惩罚诱导稀疏的表示：
$\Omega(h)=||h||_1=\sum_ih_u$

当然 $L^1$ 惩罚是使表示稀疏的方法之一。其他方法还包括从表示上的Student-t先验导出的惩罚和KL散度惩罚，这些方法对于将表示中的元素约束于单位区间上特别有用。Lee et al.(2008) 和Goodfellow et al. (2009) 都提供了正则化几个样本平均激活的例子。

还有一些其他方法通过激活值的硬性约束来获得表示稀疏。例如，正交匹配追踪（Orthogonal Matching Pursuit）通过解决以下约束优化问题将输入值 $x$ 编码成表示 $h$ ：
$arg\min_{h,||h||_0<k}||x - Wh||^2$

其中 $h||_0$ 是 $h$ 中非零项的个数。当 $W$ 被约束为正交时，我们可以高效地解决这个问题。这种方法通常被称为OMP-k，通过 $k$ 指定允许的非零特征数量。Coates and Ng证明OMP-1可以成为深度架构中非常有效的特征提取器。含有隐藏单元的模型在本质上都能变得稀疏。

参考文献：
[1] Lecun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015
[2] Aston Zhang, Zack C. Lipton, Mu Li, Alex J. Smola. Dive Into Deep Learning[J]. arXiv preprint arXiv:2106.11342, 2021.

猜你喜欢

转载自blog.csdn.net/hy592070616/article/details/130835170

深入理解深度学习——正则化（Regularization）：稀疏表示

深入理解深度学习——正则化（Regularization）：正则化和欠约束问题

深入理解深度学习——正则化（Regularization）：半监督学习

深入理解深度学习——正则化（Regularization）：Bagging和其他集成方法

深入理解深度学习——正则化（Regularization）：数据集增强

深入理解深度学习——正则化（Regularization）：参数绑定和参数共享

深入理解深度学习——正则化（Regularization）：噪声鲁棒性

深入理解深度学习——正则化（Regularization）：作为约束的范数惩罚

入理解深度学习——正则化（Regularization）：多任务学习

入理解深度学习——正则化（Regularization）：提前终止（Early Stopping）

【深度学习笔记】正则化（Regularization）

深入理解正则化

深度学习基础--正则化与norm--正则化(Regularization)

深入理解机器学习中的正则化

Group Sparse Regularization for Deep Neural Networks：深度神经网络的组稀疏正则化 (翻译)

深度学习之正则化系列（1）：深入理解参数范数惩罚(L1正则化、L2正则化)原理及tensorflow实现

透彻理解正则化（Regularization）

深度学习中的几种正则化（Regularization）方法

【DeepLearning】深入理解dropout正则化

Google---机器学习速成课程(十一)- 稀疏性正则化 (Regularization for Sparsity)

谷歌机器学习速成课程笔记 13（Regularization for Sparsity-稀疏性正则化）

机器学习--正则化(Regularization)

深入理解深度学习——BERT（Bidirectional Encoder Representations from Transformers）：输入表示

MLCC笔记13 - 稀疏性正则化 (Regularization for Sparsity)

2020-2-14 深度学习笔记7 - 深度学习中的正则化4（稀疏表示-稀疏化激活单元(元素稀疏)，Bagging和其他集成方法，Dropout-廉价Bagging近似）

深入理解正则

深度学习--深入理解Batch Normalization

深度学习中的归一化(normalization)和正则化(regularization)

机器学习之正则化（Regularization）

机器学习中的正则化（Regularization）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)