深度学习--LSTM（长短时记忆网络）原理详解

其他 2018-06-23 22:19:55 阅读次数: 2

上篇文章介绍了GRU，建议不太了解RNN和GRU的同学看看我上一篇文章：

https://blog.csdn.net/wenqiwenqi123/article/details/80707810

这篇来说一说LSTM，这两个最大的不同之处在于LSTM多了一个门。

GRU有update gate（更新门）、reset gate（重置门）。

而LSTM有三个门，update gate（更新门），forget gate（遗忘门）、output gate（输出门）。

见下图：

可以看到右边公式与左边的对比，个人认为要理解LSTM看公式比看图好使。

c<t>~为本细胞待更新的值。Γu、Γf、Γo分别为更新门、遗忘门、输出门，式中的δ为sigmoid函数，这让Γ趋向于0或者1。

与GRU不同的地方在于c<t>在更新时，（1-Γu）变为了Γf，直接用遗忘门来取值。

以及LSTM对下一细胞的输出a<t>不再等于c<t>，而是通过输出门*c<t>。

在每个结点可以有多个记忆细胞。

图一并给上：

猜你喜欢

转载自blog.csdn.net/wenqiwenqi123/article/details/80736173

深度学习--LSTM（长短时记忆网络）原理详解

【深度学习】循环神经网络RNN和长短时记忆网络LSTM(超详细原理推导和解释)

长短时记忆网络（LSTM）

长短时记忆网络LSTM

长短时记忆网络(LSTM)

LSTM（长短时记忆网络）

RNN学习笔记（一）：长短时记忆网络（LSTM）

深度学习笔记八：长短时记忆网络LSTM(基本理论)

零基础入门深度学习(6) - 长短时记忆网络(LSTM)

深度学习-43:长短时记忆神经网络(LSTM)

【深度学习理论】(7) 长短时记忆网络 LSTM

深度学习：基于长短时记忆网络LSTM实现情感分析

大数据深度学习长短时记忆网络（LSTM）：从理论到PyTorch实战演示

Keras深度学习实战（29）——长短时记忆网络详解与实现

python算法中的深度学习算法之长短时记忆网络（详解）

长短时记忆网络

长短时记忆网络(LSTM)部分组件（六）

LSTM-长短时记忆网络相关

【Deep learning】长短时记忆网络LSTM

day10-----LSTM长短时记忆网络

双向长短时记忆循环神经网络详解（Bi-directional LSTM RNN）

长短时记忆网络(Long Short Term Memory，LSTM)详解

【机器学习核心总结】什么是长短时记忆网络(LSTM)

LSTM（长短时记忆）简记

深度学习入门（3）----用长短时记忆网络进行汇率预测

Keras深度学习实战——使用长短时记忆网络构建情感分析模型

【深度学习语音识别】CNN-LSTM-DNN：CLDNN-卷积，长短时记忆，完全连接的深层神经网络

循环神经网络（RNN）及长短时记忆网络（LSTM）

基于PyTorch的LSTM长短时记忆网络实现MNIST手写数字

3-3长短时记忆神经网络(LSTM)--Tensorflow实现

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)