深度学习：循环神经网络（RNN）的变体LSTM、GRU

其他 2018-06-10 05:07:33 阅读次数: 2

假设我们试着去预测“I grew up in France… I speak fluent French”最后的词。当前的信息建议下一个词可能是一种语言的名字，但是如果我们需要弄清楚是什么语言，我们是需要先前提到的离当前位置很远的 France 的上下文的。这说明相关信息和当前预测位置之间的间隔就肯定变得相当的大。

不幸的是，在这个间隔不断增大时，RNN 会丧失学习到连接如此远的信息的能力。

LSTM

Long Short-Term Memory—— 一般就叫做 LSTM，是一种 RNN特殊的类型，可以学习长期依赖信息。

LSTM 通过刻意的设计来避免长期依赖问题。记住长期的信息在实践中是 LSTM 的默认行为，而非需要付出很大代价才能获得的能力！

这里写图片描述

忘记门，在我们 LSTM 中的第一步是决定我们会从细胞状态中丢弃什么信息。这个决定通过一个称为忘记门层完成。（eg. 一句话中，当我们看到新的主语，我们希望忘记旧的主语。）
输入门，确定什么样的新信息被存放在细胞状态中。
输出门，实际去执行——丢弃掉我们确定需要丢弃的信息，更新需要更新的信息。

GRU

Gated Recurrent Unit——一般叫做GRU，作为LSTM的一种变体，通过分析LSTM架构中哪些部分是真正需要的，进行了改进，将忘记门和输入门合成了一个单一的更新门。同样还混合了细胞状态和隐藏状态，加诸其他一些改动。最终的模型比标准的 LSTM 模型要简单，也是非常流行的变体。

这里写图片描述

复位门，控制当前状态中哪些部分用于计算下一个目标状态。
更新门，在极端情况下，可以选择全部复制或者完全替换。

复位和更新门能独立地“忽略”状态向量的一部分。

References:
[1] [译] 理解 LSTM 网络
[2] 王亮老师《深度学习》讲义

©qingdujun
2018-6-9 于北京怀柔

猜你喜欢

转载自blog.csdn.net/u012339743/article/details/80635785

深度学习：循环神经网络（RNN）的变体LSTM、GRU

深度学习实战——循环神经网络（RNN、LSTM、GRU）

TensorFlow之RNN：堆叠RNN、LSTM、GRU及双向LSTM 深度学习之循环神经网络（RNN）循环神经网络之LSTM和GRU 》

循环神经网络(RNN)及其变体GRU和LSTM的基础知识详解(公式)

[深度学习]循环神经网络：RNN，LSTM，GRU，Attention机制，沿时间的截断反向传导算法

RNN神经网络、LSTM神经网络、LSTM的变体：GRU神经网络、Tensorflow搭建第一个RNN——LSTM神经网络（分类）

循环神经网络--RNN GRU LSTM 对比分析

循环神经网络RNN、LSTM、GRU实现股票预测

循环神经网络（RNN、LSTM、GRU）以及Pytorch的使用

循环神经网络RNN、LSTM、GRU原理详解

大话循环神经网络RNN、LSTM、GRU

（三）循环神经网络RNN之LSTM和GRU

深度学习---循环神经网络RNN详解（LSTM）

深度学习（6）——循环神经网络RNN+LSTM

深度学习原理-----循环神经网络（RNN、LSTM）

深度学习：循环神经网络RNN及LSTM

机器学习（ML）九之GRU、LSTM、深度神经网络、双向循环神经网络

深度学习基本知识介绍、CNN/RNN/LSTM/GRU神经网络原理

深度学习系列（六）循环神经网络之GRU、LSTM、双向循环 2020.6.23

深度学习：循环神经网络RNN RNN以及LSTM的介绍和公式梳理

循环神经网络（RNN),长短期记忆网络（LSTM）和门控循环单元（GRU）

【深度学习】RNN循环神经网络和LSTM深度学习模型

循环神经网络-GRU和LSTM

[深度学习]理解RNN, GRU, LSTM 网络

深度学习-循环神经网络（RNN）

深度学习——循环神经网络RNN

循环神经网络原理 -- GRU、LSTM、深度循环神经网络、双向循环神经网络

循环神经网络原理 -- GRU、LSTM、深度循环神经网络、双向循环神经网络

几种常见的循环神经网络结构RNN、LSTM、GRU

循环神经网络RNN+LSTM+GRU-王而川-专题视频课程

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)