深度学习--GRU（门控循环单元）原理详解 - 代码天地

深度学习--GRU（门控循环单元）原理详解

其他 2018-06-23 22:20:10 阅读次数: 5

上一篇中已经总结了RNN的原理，传送门：https://blog.csdn.net/wenqiwenqi123/article/details/80704528

本文讲解一下GRU的原理，GRU对于RNN中的梯度消失有很大帮助。GRU即Gated Recurrent Unit。为了克服RNN无法很好处理远距离依赖而提出了LSTM，而GRU则是LSTM的一个变体，当然LSTM还有有很多其他的变体。GRU保持了LSTM的效果同时又使结构更加简单，所以它也非常流行。

先复习一下：

RNN单元中从前一个时间步得到激活值a<t-1>，将其与x<t>同时输入影响y<t>。

那么GRU的原理如下图所示：

请看右边的公式，c为记忆单元，在GRU中激活值a<t>等于c<t>。

c<t>~为在此步中可能要更新的c<t>值。

Γu为更新门，式中的δ为sigmoid函数，这让Γu趋向于0或者1。

c<t>的公式如图，当Γu为0时，则保持c<t>=c<t-1>，即记忆前一步的值。当Γu为1时，则将c<t>更新为c<t>~。

由网络来决定Γu为0还是1，即是否要记忆前一步。

如这句话所示： The cat，which already ate.....,was full。在cat时Γu为1，所以此时c<t>更新，之后的which定语从句因为要记住cat是单数，所以Γu全为0，直到was仍然记得cat为单数，在was时Γu变为1，c<t>更新，从was以后不再记得cat是单数。

Γu、c<t>和c<t>~的shape是一样的，可以定义每一个结点有多少个c（记忆单元）。

在实际应用中还有另一个门，是研究员在经过无数次实验后得出的结论，下图有一个错误c<t>在更新的时候加号应该为乘号，也就是最后一行右边应该为（1-Γu）*c<t-1>：

即Γr，重置门。更新门用于控制前一时刻的状态信息被带入到当前状态中的程度，更新门的值越大说明前一时刻的状态信息带入越多。重置门用于控制忽略前一时刻的状态信息的程度，重置门的值越小说明忽略得越多。

下一篇说一下LSTM。

猜你喜欢

转载自blog.csdn.net/wenqiwenqi123/article/details/80707810

深度学习--GRU（门控循环单元）原理详解

门控循环单元网络(GRU)在深度学习模型中的应用

GRU门控循环单元

GRU（门控循环单元）

GRU（门控循环单元）--学习笔记

深度学习入门（六十）循环神经网络——门控循环单元GRU

（十一）门控循环单元（GRU）

GRU(门控循环单元)，易懂。

门控循环单元 GRU 动手学深度学习v2

门控循环单元（GRU）基本概念与原理

pytorch学习笔记（三十一）：门控循环单元（GRU）

花书+吴恩达深度学习（十七）序列模型之长短期记忆 LSTM 和门控循环单元 GRU

李沐动手学深度学习V2-GRU门控循环单元以及代码实现

门控循环单元网络(GRU)在计算机视觉中的应用：基于深度学习模型的图像分割

序列模型（4）----门控循环单元（GRU）

GRU门控制循环单元【转载】

GRU(门控循环单元)实现股票预测

门控循环单元网络——GRU网络

（五）循环神经网络 -- 6 门控循环单元（GRU）

深度学习算法中的门控循环单元（Gated Recurrent Units）

序列模型汇总__门控循环单元（GRU）（三）

三步理解--门控循环单元(GRU)，TensorFlow实现

三步理解--门控循环单元(GRU)，TensorFlow实现。

Tensorflow2.0之实现门控循环单元（GRU）

通俗易懂GRU｜门控循环单元(gated recurrent unit， GRU)

自然语言处理--Keras 实现循环神经网络的扩展-门控循环单元GRU

循环神经网络（RNN),长短期记忆网络（LSTM）和门控循环单元（GRU）

神经网络梯度爆炸、消失问题、门控循环单元GRU、长短期记忆LSTM

时序预测 | MATLAB实GRU(门控循环单元)时间序列预测(多指标评价)

回归预测 | MATLAB实现GRU(门控循环单元)多输入单输出(多指标评价)

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)