数值稳定性和模型初始化

其他 2020-09-08 08:30:12 阅读次数: 0

《动手学深度学习pytorch》部分学习笔记，仅用作自己复习。

数值稳定性和模型初始化

深度模型有关数值稳定性的典型问题是衰减（vanishing）和爆炸（explosion）

衰减和爆炸

随机初始化模型参数

如果将每个隐藏单元的参数都初始化为相等的值，那么在正向传播时每个隐藏单元将根据相同的输⼊计算出相同的值，并传递至输出层。在反向传播中，每个隐藏单元的参数梯度值相等。因此，这些参数在使用基于梯度的优化算法迭代后值依然相等。之后的迭代也是如此。在这种情况下，⽆论隐藏单元有多少，隐藏层本质上只有1个隐藏单元在发挥作用。因此，正如在前面的实验中所做的那样，我们通常将神经网络的模型参数，特别是权重参数，进行随机初始化。

PyTorch的默认随机初始化

随机初始化模型参数的⽅法有很多。例如使⽤ torch.nn.init.normal_() 使模型 net 的权重参数采用正态分布的随机初始化方式。不过，PyTorch中 nn.Module 的模块参数都采取了较为合理理的初始化策略略（不同类型的layer具体采样的哪⼀种初始化方法的可参考源代码），因此一般不不⽤用我们考虑。

Xavier随机初始化

还有⼀种⽐较常⽤的随机初始化方法叫作Xavier随机初始化。假设某全连接层的输入个数为，输出个数为，Xavier随机初始化将使该层中权重参数的每个元素都随机采样于均匀分布

主要考虑到，模型参数初始化后，每层输出的方差不该受该层输入个数影响，且每层梯度的⽅差也不该受该层输出个数影响。

小结

深度模型有关数值稳定性的典型问题是衰减和爆炸。当神经网络的层数较多时，模型的数值稳定性容易变差。
我们通常需要随机初始化神经网络的模型参数，如权重参数。

猜你喜欢

转载自blog.csdn.net/dujuancao11/article/details/108443155

数值稳定性和模型初始化——2020.3.2

数值稳定性和模型初始化

从头学pytorch(八):数值稳定性和模型参数初始化

动手深度学习16- 深度学习的数值稳定性和模型初始化

《动手学深度学习 Pytorch版》 4.8 数值稳定性和模型初始化

机器学习（ML）八之正向传播、反向传播和计算图，及数值稳定性和模型初始化

动手学深度学习学习笔记tf2.0版（3.15 数值稳定性和模型初始化）

数值稳定性梯度爆炸梯度消失 + 模型初始化和激活函数动手学深度学习v2 pytorch

动手学深度学习V2.0(Pytorch)——14. 数值稳定性/模型初始化/激活函数

【动手学深度学习v2李沐】学习笔记09：数值稳定性、模型初始化、激活函数

数值稳定性

模型稳定性

6.2 数值稳定性

深度学习模型数值稳定性——梯度衰减和梯度爆炸的说明

模型稳定性指标—PSI

稳定性实践：开关和预案

softmax VS softmax-loss:数值稳定性

概念一：numerical stability 数值稳定性

softmax数值稳定性问题以及CrossEntropyWithLogits的由来

数值稳定性—搜狗百科

[动手学深度学习(PyTorch)]——数值稳定性

dboss稳定性

算法的稳定性

稳定性测试

排序的稳定性

算法-稳定性

算法稳定性

稳定性定义

排序算法稳定性和不稳定性归类

浅谈如何提高自动化测试的稳定性和可维护性

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)