LSTM 长短时间记忆网络 - 代码天地

LSTM 长短时间记忆网络

其他 2019-11-21 19:17:30 阅读次数: 0

　　LSTM是一种特殊的RNN网络，为了解决RNN的长依赖问题，使进行信息处理的地方可以学习到距离较远的信息。下图为RNN和LSTM的结构差异，LSTM有四个网络层。

　　

　　LSTM的核心是细胞状态，像传送带一样贯穿整个细胞，但只有很少的分支，保证信息不变的流过整个RNN。

　　

　　LSTM通过一种门结构（一个sigmoid层和一个点乘的组合）对细胞状态进行删除或者添加信息，有选择地让信息通过，σ∈[0,1]。

　　

　　具体来说，LSTM用三个门控制细胞状态，称为忘记门、输入门和输出门。

　　第一步是决定细胞状态丢弃哪些信息，通过查看h_t-1和x_t信息来输出一个0-1之间的向量，表示细胞状态C_t-1中哪些细胞保留或丢弃多少。

　　

　　第二步是决定给细胞状态增加哪些新的信息，分为两部，首先利利用h_t-1和x_t通过一个输入门来决定更新哪些信息，然后利用ht-1和xt通过一个tanh层得到新的候选细胞信息，这些信息可能会被更新到细胞信息中。

　　

　　第三步将旧的细胞信息C_t-1变为新细胞信息C_t。通过忘记门选择忘记旧细胞信息的一部分，通过输入门选择增加候选细胞信息的一部分。

　　

　　第四步更新完细胞状态后需要根据输入的h_t-1和x_t来判断输出细胞的哪些状态特征，将输入经过输出门的sigmoid层，然后将细胞状态经过tanh层得到-1~1之间值的向量，该向量与输出门得到的判断条件相乘得到最终该RNN的输出

　　

　　LSTMs对于RNNs的使用是一大进步。那么现在还有个问题，是否还有更大的进步？对于很多研究者来说，但是是肯定的，那就是attention的问世。attention的思想是让RNN在每一步挑选信息的时候都能从更大的信息集里面挑选出有用信息。例如，利用RNN模型为一帧图片生成字母，它将会选择图片有用的部分来得到有用的输入，从而生成有效的输出。事实上， Xu, et al.(2015) 已经这么做了，attention方向还有一些振奋人心的研究，但还有很多东西等待探索......

参考文献：

⭕ 理解LSTM MichaelLiu_dev简书

猜你喜欢

转载自www.cnblogs.com/xxdk/p/11907554.html

LSTM 长短时间记忆网络

长短时记忆网络（LSTM）

长短时记忆网络LSTM

长短时记忆网络(LSTM)

LSTM（长短时记忆网络）

基于LSTM（长短时极记忆网络）与AR自回归模型的时间序列预测

长短时记忆网络(LSTM)部分组件（六）

深度学习--LSTM（长短时记忆网络）原理详解

LSTM-长短时记忆网络相关

【Deep learning】长短时记忆网络LSTM

RNN学习笔记（一）：长短时记忆网络（LSTM）

day10-----LSTM长短时记忆网络

LSTM（长短时记忆）简记

LSTM（长短期记忆网络）

LSTM 长短期记忆网络

循环神经网络（RNN）及长短时记忆网络（LSTM）

基于PyTorch的LSTM长短时记忆网络实现MNIST手写数字

深度学习笔记八：长短时记忆网络LSTM(基本理论)

3-3长短时记忆神经网络(LSTM)--Tensorflow实现

3-2长短时记忆神经网络(LSTM)--Keras实现

3-1长短时记忆神经网络(LSTM)--简单代码实现

tensorflow入门笔记(十三)长短时记忆神经网络LSTM

双向长短时记忆循环神经网络详解（Bi-directional LSTM RNN）

Bi-directional LSTM RNN（双向长短时记忆循环神经网络）

零基础入门深度学习(6) - 长短时记忆网络(LSTM)

深度学习-43:长短时记忆神经网络(LSTM)

通俗LSTM长短时记忆循环神经网络介绍

【深度学习理论】(7) 长短时记忆网络 LSTM

长短时记忆网络(Long Short Term Memory，LSTM)详解

长短时记忆网络（LSTM）在序列数据处理中的优缺点分析

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)