防止神经元饱和的若干方法

其他 2018-05-28 18:19:11 阅读次数: 1

介绍一些技巧，防止神经元饱和导致学习缓慢。

更好的代价函数和激活函数

前面已经介绍，我们使用corss entropy function+sigmoid function 或者softmax active fuction + log-likehood能够较好的避免学习缓慢的问题，具体请参考这里。

但请注意，这里我们只针对输出神经元在错误的值上饱和导致的学习下降，而对隐藏层的神经元毫无办法。

权重初始化

标准正太分布初始化

最常见的初始化神经元方法是使用标准正态分布随机初始化，这会带来一个问题。

设想，我们第一层神经元的 $w、b$ 已经初始化为服从 $U(0,1)$ 的正态分布，且输入 $x$ 为0或者1，这里假设为0的有500个，1也有五百个。

因此，我们考虑带权和：

z = \sum_{j} w_{j} x_{j} + b

$z = \sum_j w_jx_j + b$

不难得到， $z$ 服从 $U(0,501)$ 的正太分布。这将导致我们的 $z$ 非常分散，也就是说 $z >>1$ 或者 $z<<-1$ 。这对我们是非常不利的，因为这将导致 $\sigma(z)$ 接近1或者0，神经网络将很难继续学习。

减小标准差进行初始化

因此，我们可以将 $w$ 初始化为服从 $U(0,\frac{1}{n_{in}})$ 的高斯分布，其中 $n_{in}$ 表示有这么多个输入权重的神经元。

这样，根据上面假设的例子， $z$ 会服从 $U(0,\frac{3}{2})$ 的正态分布，比之前好了很多。

为什么不处理 $b$

经验表明，如何初始化偏置影响不大。

有些人甚至将偏置初始化为0也可以。

猜你喜欢

转载自blog.csdn.net/crazy_scott/article/details/80343312

防止神经元饱和的若干方法

神经元与权重

单个神经元

多组神经元

神经元的构造

神经元分类

HOUDINI 神经元

5、Tensorflow基础（三）神经元函数及优化方法

神经元拟合原理

[DL]单个神经元

LSTM的神经元个数

LIF神经元介绍

神经元和突触

从神经元到神经网络

神经元是如何组成神经网？

自适应线性神经元

机器学习0003 简单神经元

脉冲神经元模型

神经元与网络结构概论

人工神经元网络

二值随机神经元

neuroscience 神经元的相互作用

【XSY2519】神经元（neuron）

简单的神经元模型

单个神经元相关总结

Python3神经元学习

【prufer序列】【dp】神经元（neuron）

简单的神经元算法实现(python)

基于神经元分析手牌

大数据神经元的概念

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)