GRU（门控循环单元）--学习笔记 - 代码天地

GRU（门控循环单元）--学习笔记

其他 2018-11-12 19:26:28 阅读次数: 0

版权声明：转载请声明转自Juanlyjack https://blog.csdn.net/m0_38088359/article/details/83960108

0、门控循环单元

门控循环神经网络可以更好地捕捉时间序列中时间步距离较大的依赖关系，通过引入了门的概念，修改循环神经网络中隐藏状态的计算方式，它包括重置门、更新门、候选隐藏状态和隐藏状态。

重置门有助于捕捉时间序列里短期的依赖关系。更新门有助于捕捉时间序列里长期的依赖关系。

1、重置门和更新门

门控循环单元中的重置门（reset gate）和更新门（update gate）的输入均为当前时间步输入 Xt 与上一时间步隐藏状态 Ht−1，输出由激活函数为 sigmoid 函数的全连接层计算得到。
在这里插入图片描述

举个例子：
在这里插入图片描述
其中：

2、候选隐藏状态

门控循环单元将计算候选隐藏状态来辅助稍后的隐藏状态计算。将当前时间步重置门的输出与上一时间步隐藏状态做按元素乘法（符号为 ⊙）。

如果重置门中元素值接近 0，那么意味着重置对应隐藏状态元素为 0，即丢弃上一时间步的隐藏状态。如果元素值接近 1，那么表示保留上一时间步的隐藏状态。

然后，将按元素乘法的结果与当前时间步的输入连结，再通过含激活函数 tanh 的全连接层计算出候选隐藏状态，其所有元素的值域为 [−1,1]。

在这里插入图片描述

按照上面那个例子：
在这里插入图片描述

3、隐藏状态

候选隐藏状态只是为了更新新的隐藏状态，而并不是隐藏状态。所以接下来时间步t的隐藏状态计算需要用当前的时间步更新Zt来对上一步的隐藏状态Ht-1和当前时间步的候选隐藏状态做组合。

还是按照上面这个例子：
在这里插入图片描述
计算结构图如下图所示：

4、GRU训练

输出层的输入为：
在这里插入图片描述
输出为：

某时刻的损失函数为：

训练中整个抽样的样本的损失为：

以下是梯度下降更新过程：

在往后的章节中会使用MXNet的gluon来实践GRU。

学习参考1
学习参考2

猜你喜欢

转载自blog.csdn.net/m0_38088359/article/details/83960108

GRU（门控循环单元）--学习笔记

pytorch学习笔记（三十一）：门控循环单元（GRU）

GRU门控循环单元

GRU（门控循环单元）

（十一）门控循环单元（GRU）

GRU(门控循环单元)，易懂。

深度学习--GRU（门控循环单元）原理详解

门控循环单元网络(GRU)在深度学习模型中的应用

序列模型（4）----门控循环单元（GRU）

GRU门控制循环单元【转载】

GRU(门控循环单元)实现股票预测

门控循环单元网络——GRU网络

深度学习入门（六十）循环神经网络——门控循环单元GRU

（五）循环神经网络 -- 6 门控循环单元（GRU）

门控循环单元 GRU 动手学深度学习v2

序列模型汇总__门控循环单元（GRU）（三）

三步理解--门控循环单元(GRU)，TensorFlow实现

门控循环单元（GRU）基本概念与原理

三步理解--门控循环单元(GRU)，TensorFlow实现。

Tensorflow2.0之实现门控循环单元（GRU）

花书+吴恩达深度学习（十七）序列模型之长短期记忆 LSTM 和门控循环单元 GRU

李沐动手学深度学习V2-GRU门控循环单元以及代码实现

门控循环单元网络(GRU)在计算机视觉中的应用：基于深度学习模型的图像分割

通俗易懂GRU｜门控循环单元(gated recurrent unit， GRU)

自然语言处理--Keras 实现循环神经网络的扩展-门控循环单元GRU

循环神经网络（RNN),长短期记忆网络（LSTM）和门控循环单元（GRU）

神经网络梯度爆炸、消失问题、门控循环单元GRU、长短期记忆LSTM

时序预测 | MATLAB实GRU(门控循环单元)时间序列预测(多指标评价)

回归预测 | MATLAB实现GRU(门控循环单元)多输入单输出(多指标评价)

多维时序 | MATLAB实现GRU门控循环单元多变量时间序列预测(多指标评价)

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)