【深度学习】深度学习中RNN梯度消失 - 代码天地

【深度学习】深度学习中RNN梯度消失

其他 2018-06-08 05:08:23 阅读次数: 2

RNN梯度消失理解

深度学习与RNN模型

**深度学习主要思想为统计不变性（最主要的是权重共享，大大降低神经网络中的向量维数，一定程度上可以避免过拟合同时也能降低计算量），表现在空间上权重共享上体现为CNN（Convolutional Neural Network），时间上权重共享体现为RNN（Recurrent Neural Networks）。
RNN前向传播：: 处理序列数据，如下图：; 该图为unrolling状态的RNN，将每个时刻的输入输出以及互相的影响更为直观的体现出来，上一时刻的隐藏层输出会对下一时刻的隐藏层产生影响，公式体现为：
RNN反向传播（BP）更新参数：: 假定目前在t时刻，需要更新至t=1时刻之间的参数，定义L为损失函数，公式如下：; 若theta初始化为小于1的数，假如前向传播了上万次，那么在反向传播更新t=1时的参数时，导致求得的偏导极小，接近于0（小于1的数连续相乘），从而导致了所谓的梯度消失现象。
梯度消失会使RNN的长时记忆失效，因为无法更新参数，关于梯度消失的解决方案，下个博客再续！

猜你喜欢

转载自blog.csdn.net/qq_29340857/article/details/70556307

【深度学习】深度学习中RNN梯度消失

【深度学习】RNN中梯度消失的解决方案（LSTM）

深度学习中的梯度消失与梯度爆炸

【深度学习】RNN的梯度消失/爆炸与正交初始化

深度学习中的激活函数与梯度消失

深度学习中梯度消失的理解

梯度消失：深度学习的挑战

[深度学习] 梯度消失与梯度爆炸

深度学习-梯度爆炸和梯度消失

【深度学习】：梯度消失与梯度爆炸

深度学习-梯度消失和梯度爆炸

深度学习梯度爆炸与梯度消失

深度学习《梯度消失和梯度爆炸》

深度学习——梯度消失、梯度爆炸

【深度学习笔记】梯度消失与梯度爆炸

深度学习（七）激活函数与梯度消失

【深度学习】梯度消失和爆炸

【机器学习】【RNN中的梯度消失与梯度爆炸】

机器学习中的数学——深度学习优化的挑战：梯度消失和梯度爆炸

深度学习之如何防止梯度爆炸/梯度消失?

深度学习之详解梯度爆炸和梯度消失

动手深度学习之# 梯度消失、梯度爆炸

深度学习笔记 3 梯度消失和梯度爆炸

深度学习中的梯度消失、梯度爆炸问题的原因以及解决方法

【深度学习系列】DNN中梯度消失和梯度爆炸的原因推导

梯度爆炸与深度学习中的梯度剪枝

深度学习—梯度消失和爆炸、权重初始化

深度学习剖根问底：梯度消失以及爆炸

【读书1】【2017】MATLAB与深度学习——消失的梯度(1)

深度学习之梯度消失与爆炸原因公式推导

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)