序列模型汇总__门控循环单元（GRU）（三） - 代码天地

序列模型汇总__门控循环单元（GRU）（三）

编程语言 2019-04-25 16:51:52 阅读次数: 0

简介

GRU是LSTM网络的一种效果很好的变体，它较LSTM网络的结构更加简单，而且效果也很好，因此也是当前非常流形的一种网络。GRU既然是LSTM的变体，因此也是可以解决RNN网络中的长依赖问题。
GRU与LSTM相比，少了一个gate，由此就少了一些矩阵乘法，GRU虽与LSTM的效果较近，但却因此在训练中节省了很多时间，在文本类处理中，相比用LSTM，更建议用GRU来训练。

GRU原理：
在LSTM中引入了三个门函数：输入门、遗忘门和输出门来控制输入值、记忆值和输出值。而在GRU模型中只有两个门：分别是更新门和重置门。具体结构如下图所示：
在这里插入图片描述
图中的zt和rt分别表示更新门和重置门。更新门用于控制前一时刻的状态信息被带入到当前状态中的程度，更新门的值越大说明前一时刻的状态信息带入越多。重置门控制前一状态有多少信息被写入到当前的候选集 h~t 上，重置门越小，前一状态的信息被写入的越少。

GRU前向传播计算：
根据上面的GRU的模型图，我们来看看网络的前向传播公式：
在这里插入图片描述
LSTM与GRU对比：

对memory 的控制
LSTM：用output gate 控制，传输给下一个unit。
GRU：直接传递给下一个unit，不做任何控制。
input gate 和reset gate 作用位置不同
LSTM：计算new memory 时，不对上一时刻的信息做任何控制，而是用forget gate 独立的实现这一点。
GRU: 计算new memory 时利用reset gate 对上一时刻的信息进行控制。

而它们最大的相似之处就是，在从t 到 t-1 的更新时都引入了加法。
这个加法的好处在于能防止梯度弥散，因此LSTM和GRU都比一般的RNN效果更好。

猜你喜欢

转载自blog.csdn.net/qq_42823043/article/details/89504096

序列模型汇总__门控循环单元（GRU）（三）

序列模型（4）----门控循环单元（GRU）

GRU门控循环单元

GRU（门控循环单元）

（十一）门控循环单元（GRU）

GRU(门控循环单元)，易懂。

门控循环单元网络(GRU)在深度学习模型中的应用

三步理解--门控循环单元(GRU)，TensorFlow实现

三步理解--门控循环单元(GRU)，TensorFlow实现。

花书+吴恩达深度学习（十七）序列模型之长短期记忆 LSTM 和门控循环单元 GRU

GRU（门控循环单元）--学习笔记

GRU门控制循环单元【转载】

GRU(门控循环单元)实现股票预测

门控循环单元网络——GRU网络

时序预测 | MATLAB实GRU(门控循环单元)时间序列预测(多指标评价)

多维时序 | MATLAB实现GRU门控循环单元多变量时间序列预测(多指标评价)

时序预测 | MATLAB实现PSO-GRU(粒子群优化门控循环单元)时间序列预测

时间序列预测 | WOA-GRU鲸鱼算法优化门控循环单元

时序预测 | MATLAB实现TCN-GRU时间卷积门控循环单元时间序列预测

时序预测 | MATLAB实现基于EMD-GRU时间序列预测（EMD分解结合GRU门控循环单元）

时序预测 | MATLAB实现EEMD-GRU、GRU集合经验模态分解结合门控循环单元时间序列预测对比

（五）循环神经网络 -- 6 门控循环单元（GRU）

深度学习--GRU（门控循环单元）原理详解

门控循环单元（GRU）基本概念与原理

Tensorflow2.0之实现门控循环单元（GRU）

pytorch学习笔记（三十一）：门控循环单元（GRU）

区间预测 | MATLAB实现QRCNN-GRU卷积门控循环单元分位数回归时间序列区间预测

时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测

区间预测 | MATLAB实现基于QRCNN-GRU卷积门控循环单元多变量时间序列区间预测

时序预测 | MATLAB实现BO-GRU贝叶斯优化门控循环单元时间序列预测

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)