长短时记忆网络(LSTM)

其他 2019-02-18 23:35:37 阅读次数: 0

长短时记忆网络

循环神经网络很难训练的原因导致它的实际应用中很处理长距离的依赖。本文将介绍改进后的循环神经网络：长短时记忆网络(Long Short Term Memory Network, LSTM)，

原始RNN的隐藏层只有一个状态，即h，它对于短期的输入非常敏感。那么如果我们再增加一个状态，即c，让它来保存长期的状态，这就是长短时记忆网络。

新增加的状态c，称为单元状态。我们把上图按照时间维度展开：

可以看到在t时刻，LSTM的输入有三个：当前时刻网络的输出值$x_t$、上一时刻KSTM的输出值$h_{t-1}$、以及上一时刻的单元状态$c_{t-1}$；LSTM的输出有两个：当前时刻LSTM输出值$h_t$、和当前时刻的单元状态$x_t$。注意$x、h、c$都是向量。

LSTM的关键，就是怎样控制长期状态c。在这里，LSTM的思路是使用三个控制开关。第一个开关，负责控制继续保存长期状态c；第二个开关，负责控制把即时状态输入到长期状态c；第三个开关，负责控制是否把长期状态c作为当前的LSTM的输出。三个开关的作用如下图所示：

接下来我们要描述一下，输出h和单元状态c的具体计算方法。

长短时记忆网络的前向计算

我们引入“门(gate)”的概念。门实际上就是一层全连接层，它的输入是一个向量，输出是一个0到1之间的实数向量。假设W是门的权重向量，$b$

猜你喜欢

转载自www.cnblogs.com/LXP-Never/p/10398531.html

长短时记忆网络（LSTM）

长短时记忆网络LSTM

长短时记忆网络(LSTM)

LSTM（长短时记忆网络）

长短时记忆网络

长短时记忆网络(LSTM)部分组件（六）

深度学习--LSTM（长短时记忆网络）原理详解

LSTM-长短时记忆网络相关

【Deep learning】长短时记忆网络LSTM

RNN学习笔记（一）：长短时记忆网络（LSTM）

day10-----LSTM长短时记忆网络

LSTM（长短时记忆）简记

循环神经网络（RNN）及长短时记忆网络（LSTM）

基于PyTorch的LSTM长短时记忆网络实现MNIST手写数字

3-3长短时记忆神经网络(LSTM)--Tensorflow实现

3-2长短时记忆神经网络(LSTM)--Keras实现

深度学习笔记八：长短时记忆网络LSTM(基本理论)

3-1长短时记忆神经网络(LSTM)--简单代码实现

tensorflow入门笔记(十三)长短时记忆神经网络LSTM

双向长短时记忆循环神经网络详解（Bi-directional LSTM RNN）

零基础入门深度学习(6) - 长短时记忆网络(LSTM)

Bi-directional LSTM RNN（双向长短时记忆循环神经网络）

深度学习-43:长短时记忆神经网络(LSTM)

通俗LSTM长短时记忆循环神经网络介绍

【深度学习理论】(7) 长短时记忆网络 LSTM

长短时记忆网络(Long Short Term Memory，LSTM)详解

长短时记忆网络（LSTM）在序列数据处理中的优缺点分析

长短时记忆网络(LSTM)在文本生成和语言模型中的应用

【机器学习核心总结】什么是长短时记忆网络(LSTM)

解密长短时记忆网络（LSTM）：从理论到PyTorch实战演示

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

使用Redis中间件解决商品秒杀活动中出现的超卖问题（使用Java多线程模拟高并发环境）

野指针及c++指针使用注意点

redis 3.0　新特性

(翻译)火狐操作系统javascript API

微信小程序开发入门

mysql数据查询之五子句(where、group by、having、order by和limit)

Codeforces Round #517 Div. 1翻车记

在caffe 中实现Generative Adversarial Nets（二）

企业级漏洞扫描工具

java byte数组与String互转

每日归档

更多

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)