Long Short term memory unit(LSTM)

其他 2019-01-23 10:31:00 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Solo95/article/details/86515900

整理并翻译自吴恩达深度学习系列视频：序列模型第一周。

Prerequisite：Gated Recurrent Unit(GRU)

Long Short term memory unit(LSTM)

在这里插入图片描述
GRU 和 LST的对比。

LTSM计算公式如下：
$\tilde{C}^{<t>}=tanh(W_c[C^{<t-1>}, x^{<t>}]+b_c)$
$\Gamma_u=\sigma(W_u[C^{<t-1>}, x^{<t>}]+b_u)$
$\Gamma_f=\sigma(W_f[C^{<t-1>}, x^{<t>}]+b_f)$
$\Gamma_o=\sigma(W_0[C^{<t-1>}, x^{<t>}]+b_o)$
$C{<t>}=\Gamma_u\tilde{C}^{<t>}+(1-\Gamma_u)C^{<t-1>}$
$a{<t>}=\Gamma_o*C^{<t>}$

LSTM有三个门控值，使用 $\Gamma_f$ 替换GRU里的 $1-\Gamma_u$ ，并且增加一个新的 $\Gamma_o$ 来控制输出的值。

LSTM的图示结构如下图所示：
在这里插入图片描述
如图红色直线所示，只要三个门控值 $\Gamma_u$ 、 $\Gamma_f$ 、 $\Gamma_o$ 设置得当，我们需要的信息可以一直向后传递。

这种结构的常见变种是peephole connection，即计算门控值时，也使用了前一层的 $C^{<t-1>}$ ，如图中绿色圈起来的部分。

GRU其实是LSTM的一种简化版本，事实上LTSM先于GRU被发明出来。

GRU只有2个门控值，简单，计算快，可以扩展到更大的模型上；LSTM有三个门控值，更强大，更灵活。历史上，LTSM经常被当做首位的默认选择，但最近几年GRU获得了很多团队的支持，因为它很简单，也能做出很好地效果，更容易扩展到更大的问题。

猜你喜欢

转载自blog.csdn.net/Solo95/article/details/86515900

Long Short term memory unit(LSTM)

LSTM(Long Short Term Memory)

LSTM（Long-Short Term Memory,LSTM）

LSTM学习—Long Short Term Memory networks

Long Short-Term Memory (LSTM)

Long Short-Term Memory（LSTM）

LSTM(Long Short-Term Memory)和LSTM例子理解

RNN--长短期记忆(Long Short Term Memory, LSTM)

基于LSTM（Long Short-Term Memory）的实时异常检测

长短期记忆神经Long Short-Term Memory（ LSTM）

长短时记忆(long short-term memory)LSTM

简单聊聊Long Short Term Memory Network (LSTM)和 Gated Recurrent Unit (GRU)两种强大的RNN变体

CNN Long Short-Term Memory

Long Short-Term Memory 学习笔记

长短期记忆网络（Long Short-Term Memory，LSTM）及其变体双向LSTM和GRU

Attention-Based Bidirectional Long Short-Term Memory for Relation Classification双向lstm实体关系分类

非监督特征学习与深度学习（十五）--------长短记忆（Long Short Term Memory，LSTM）

[神经网络学习笔记]长短期记忆模型（Long-Short Term Memory，LSTM）综述

长短时记忆网络(Long Short Term Memory，LSTM)详解

深度学习5：长短期记忆网络 – Long short-term memory | LSTM

Long-Short-Term-Memories（LSTM）

Sequence Models and Long-Short Term Memory Networks

Video Summarization with Long Short-term Memory（论文翻译）

Attention-Based Bidirectional Long Short-Term Memory Networks for

Video Summarization with Long Short-Term Memory论文翻译

Speech and Language Processing之Long Short-Term Memory

4 Short-Term Load Forecasting using A Long Short- Term Memory Network

【先挖坑】循环神经网（RNN）与长短时记忆网LSTM（Long Short Term Memory networks）

（KWS-LSTM）Max-pooling loss training of long short-term memory networks for small-footprint KWS

《How to Reshape Input Data for Long Short-Term Memory Networks in Keras》学习笔记

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)