数值稳定性和模型初始化——2020.3.2 - 代码天地

数值稳定性和模型初始化——2020.3.2

其他 2020-03-02 23:00:58 阅读次数: 0

一、衰减和爆炸

当神经⽹络的层数较多时，模型的数值稳定性容易变差。例如假设权重分别为0.2和5，\(0.2^{30} \approx 1\times 10^{-21}\)(此时得到一个很小的数，会导致神经元学习非常慢，从而导致衰减。),\(5^{30} \approx 9\times 10^{20}\)(此时得到一个非常大的数，因此造成梯度爆炸。)

二、随机初始化模型参数

如果一个网络里面包含若干神经元，这些参数在基于梯度的优化算法迭代后值依然相等，之后的迭代也是如此。那么着若干个神经元就好比等同于一个神经元，为了使其余的神经元发挥作用，因此需要进行随机初始化。

（一）PyTorch默认随机初始化

可以使用torch.nn.init.normal_()使模型net的权重参数采用正态分布的随机初始化方式。其中nn.model对每一个layer采取的初始化策略都有考量，可参考源代码.

（二）Xavier随机初始化

还有⼀种⽐较常⽤的随机初始化⽅法叫作Xavier随机初始化[1]。假设某全连接层的输⼊个数为 \(a\)，输出个数为 \(b\) ，Xavier随机初始化将使该层中权᯿参数的每个元素都随机采样于均匀分布:
\[ U\left(- \sqrt{\frac{6}{a + b}},\sqrt{\frac{6}{a + b}}\right) \]
它的设计主要考虑到，模型参数初始化后，每层输出的⽅差不该受该层输⼊个数影响，且每层梯度的⽅
差也不该受该层输出个数影响。

三、小结

深度模型有关数值稳定性的典型问题是衰减和爆炸。当神经⽹络的层数较多时，模型的数值稳定性容易变差。
我们通常需要随机初始化神经⽹络的模型参数，如权重参数。

猜你喜欢

转载自www.cnblogs.com/somedayLi/p/12398657.html

数值稳定性和模型初始化——2020.3.2

数值稳定性和模型初始化

从头学pytorch(八):数值稳定性和模型参数初始化

动手深度学习16- 深度学习的数值稳定性和模型初始化

《动手学深度学习 Pytorch版》 4.8 数值稳定性和模型初始化

机器学习（ML）八之正向传播、反向传播和计算图，及数值稳定性和模型初始化

动手学深度学习学习笔记tf2.0版（3.15 数值稳定性和模型初始化）

数值稳定性梯度爆炸梯度消失 + 模型初始化和激活函数动手学深度学习v2 pytorch

动手学深度学习V2.0(Pytorch)——14. 数值稳定性/模型初始化/激活函数

【动手学深度学习v2李沐】学习笔记09：数值稳定性、模型初始化、激活函数

数值稳定性

模型稳定性

6.2 数值稳定性

深度学习模型数值稳定性——梯度衰减和梯度爆炸的说明

模型稳定性指标—PSI

稳定性实践：开关和预案

softmax VS softmax-loss:数值稳定性

概念一：numerical stability 数值稳定性

softmax数值稳定性问题以及CrossEntropyWithLogits的由来

数值稳定性—搜狗百科

[动手学深度学习(PyTorch)]——数值稳定性

dboss稳定性

算法的稳定性

稳定性测试

排序的稳定性

算法-稳定性

算法稳定性

稳定性定义

排序算法稳定性和不稳定性归类

浅谈如何提高自动化测试的稳定性和可维护性

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)