深度学习-初始化权重矩阵 - 代码天地

深度学习-初始化权重矩阵

其他 2018-04-26 12:18:54 阅读次数: 2

1.初始化权重矩阵为0

没有梯度传播，因为隐层节点之后的所有数值均为0。多层神经网络表现的跟线性模型一样，不可取！

2.随机初始化权重矩阵

（1）标准正态分布

　　np.random.rand(size_l,size_l-1)

　　可能导致梯度下降或者梯度爆炸的问题

（2）启发式来根据非线性激活函数初始化权重

　　 ---梯度下降

　　　　对于深度网络来说，对于任何激活函数，梯度将随着反向传播期间每层向后移动变得越来越小。梯度变小，权重更新缓慢，网络收敛速度变慢。甚至可能阻止网络进一步训练！

　　---梯度爆炸

　　　　与梯度下降相反，对于任何激活函数，梯度变化越来越大，可能导致网络跳过最优值或者在附近波动，而永远无法收敛。

解决方法：启发式方法

　　对于激活函数ReLu：

　　　　W^[l] = np.random.rand(size_l,size_l-1)*np.sqrt(2/size_l-1)

　　对于激活函数tanh（又称为Xavier初始化）：

　　　　W^[l] = np.random.rand(size_l,size_l-1)*np.sqrt(1/size_l-1)

　　其他形式的启发式方法：

　　　　W^[l] = np.random.rand(size_l,size_l-1)*np.sqrt(1/(size_l-1+size_l))

　　

猜你喜欢

转载自www.cnblogs.com/logo-88/p/8951333.html

深度学习-初始化权重矩阵

【深度学习】权重初始化

深度学习的几种权重初始化

深度学习的几种权重初始化

深度学习权重初始化

深度学习之权重初始化

深度学习—梯度消失和爆炸、权重初始化

深度学习神经网络中权重的初始化

深度学习最佳实践系列——权重w初始化

深度学习笔记：1.11 权重初始化

深度学习——神经网络权重初始化问题

解析深度学习神经网络权重初始化

深度学习－－神经网络权重初始化

深度学习入门笔记（十二）：权重初始化

深度学习-六种权重初始化

深度学习基础-神经网络权重初始化

深度学习中常用的权重初始化方式

权重初始化

tnsorflow中常用的几种权重矩阵初始化的方式

深度学习中神经网络的几种权重初始化方法

[深度学习]数据预处理与神经网络权重的初始化

吴恩达深度学习笔记(37)-神经网络的权重初始化再解析

「深度学习」「keras开发」keras权重初始化疑惑说明

深度学习之:神经网络参数(权重)初始化

[深度学习] 使用Xavier进行权重初始化的原理以及caffe实现

【深度学习理论】(4) 权重初始化，Batch Normalization

深度学习：初始化

深度神经网络中的权重初始化方法

tensorflow 权重初始化

权重初始化总结

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)