LSTM学习笔记|Understanding LSTM and its diagrams - 代码天地

LSTM学习笔记|Understanding LSTM and its diagrams

其他 2019-03-24 14:58:02 阅读次数: 0

这是LSTM的一个储存单元。

将其看作一个黑盒，只看其输入输出。

三个输入分别是：

X_t：当前时间的输入
h_t-1：上一个LSTM单元的输出
C_t-1：上一个单元的存储器
h_t：该单元的输出
C_t：该单元的内存

这是多个单元的连接图

在LSTM图中，顶部是内存管道，输入是旧的内存。

它会首先穿过第一个阀门：X 忘记阀门。实际上，这个一个逐元素做乘法的运算单元，如果权重接近零则要忘记大部分记忆。

然后，它会通过第二个操作符：+ 。这里将进行分段求和，将新内存和旧内存结合起来。

之后，就会把旧内存更改为新内存。

在这部分，第一个是忘记阀门。它由简单的神经网络控制。输入是h_t-1，X_t，C_t-1。偏置量b_0。这个神经网络有sigmod函数作为激活函数。它的输出向量是忘记阀门，其将逐元素应用于C_t-1。

第二个阀门是新记忆阀门（左）。同样，是一个单层简单神经网络，输入与忘记阀门相同。该阀门控制新内存影响就内存的程度。

右侧是新记忆，使用tanh作为激活函数。

这两个阀门分别是：忘记阀门和新记忆阀门。

最后一部我们需要产生这个单元的最终输出。这步骤的输出值是由新的记忆、之前的输出、输入和一个偏置向量决定的，这个值控制新的记忆应该输出到下一个LSTM的。

最常用的结构是下图，主要区别在于下图不同记忆单元C看做单元输入，而是作为内部的Cell。

下图试着用虚线和实线来表达延迟和顺序，虚线表达旧的记忆，这在开始是有效的。一些实线表示新的记忆。操作的执行必须要求新的记忆等待C_t可用。

即：

分部分分析：

这个是忘记阀门，用来减少过去的记忆。

这是新的记忆和记忆阀门。

这是两个阀门和元素求和器，来合并就的记忆和新的记忆，来生成C_t。流回Cell。

这是输出阀门和LSTM单元的输出。

猜你喜欢

转载自www.cnblogs.com/billdingdj/p/10588107.html

LSTM学习笔记|Understanding LSTM and its diagrams

LSTM

【LSTM】

【转】Understanding LSTM

Understanding LSTM Networks

Understanding LSTM Networks 译文

understanding LSTM networks(zhuan)

Top 8 Diagrams for Understanding Java

Understanding LSTM Networks（LSTM的网络结构）

理解 LSTM 网络（Understanding LSTM Networks by colah）

转载LSTM学习笔记

LSTM学习笔记

LSTM笔记

Top 8 Diagrams for Understanding Java（转）

Java_Top 8 Diagrams for Understanding Java

RNN、LSTM与GRU学习笔记

深度学习笔记-LSTM解析

深度学习笔记(五)：LSTM

LSTM以及Conv LSTM

"LSTM的参数解释，LSTM

【LSTM】理解LSTM

（译）理解 LSTM 网络（Understanding LSTM Networks by colah）

简单理解LSTM网络（Understanding LSTM Networks by colah）

（译）理解LSTM网络 ----Understanding LSTM Networks by colah

理解LSTM神经网络（Understanding LSTM Networks翻译）

理解LSTM网络（Understanding LSTM Networks）原文与翻译

【笔记】单向LSTM与双向LSTM对比

[转] Understanding-LSTMs 理解LSTM

翻译：《Understanding LSTM Netword》，附原文

pytorch笔记：07)LSTM

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)