【AI】_03_LSTM & GRU - 代码天地

【AI】_03_LSTM & GRU

其他 2020-03-08 13:30:46 阅读次数: 0

文章目录

【一】 Long Short Term Memory Network（长短期记忆）
【二】 Forget / Input / Output Gate（3个门）
【三】 LSTM 应用场景
【四】 Bi-LSTM（双向 LSTM）
【五】 RNN · LSTM · Bi-LSTM - 对比
【六】 GRU - Gate Recurrent Unit

【一】 Long Short Term Memory Network（长短期记忆）

通过三个门，遗忘门，输入门，输出门，控制信息的流动，解决梯度消失问题

【二】 Forget / Input / Output Gate（3个门）

Forget Gate（遗忘门，0~1）

$\bm {f ^ { ( t ) }} = \sigma ( w _ { f } \cdot h _ { (t - 1) } + u _ { f } \cdot x _ { t } + b_f) \;--\;(w_f, u_f, b_f)$

Input Gate（输入门，0~1）

$\bm {i ^ { ( t ) }} = \sigma ( w _ { i } \cdot h _ { (t - 1) } + u _ { i } \cdot x _ { t } + b_i) \;--\;(w_i, u_i, b_i)$

Ouput Gate（输出门，0~1）

$\bm {o ^ { ( t ) }} = \sigma ( w _ { o } \cdot h _ { (t - 1) } + u _ { o } \cdot x _ { t } + b_o) \;--\;(w_o, u_o, b_o)$

Extra Information（在 $t$ 时刻额外得到的信息）

$\bm {\tilde { c } ^ { ( t ) }}= tanh ( w _ { c } \cdot h _ { (t - 1) } + u _ { c } \cdot x _ { t } + b_c) \;--\;(w_c, u_c, b_c)$

Final Information（在 $t$ 时刻最终的信息， $\circ$ 表示向量相乘）

$\bm {{ c } ^ { ( t ) }} = f^{(t)} \circ c^{(t-1)} + i^{(t)} \circ \tilde { c } ^ { ( t ) }$

Final hidden layer（通过那些信息计算 $h_t$ ）

$\bm {{ h } _ { t }} = o^{(t)} \circ tanh{(c^{(t-1)})}$

【三】 LSTM 应用场景

【四】 Bi-LSTM（双向 LSTM）

【五】 RNN · LSTM · Bi-LSTM - 对比

【六】 GRU - Gate Recurrent Unit

模型架构

Update Gate（更新门）：在 $t$ 时刻会有新的数据，从该信息中心抽取多少的信息，放到 $h_t$ 里面

$\bm {u ^ { ( t ) }} = \sigma ( w _ { u } \cdot h _ { (t - 1) } + u _ { u } \cdot x _ { t } + b_u) \;--\;(w_u, u_u, b_u)$

Reset Gate（重置门）：和 LSTM 的 Forget Gate 类似，忘记或保留多少旧的信息

$\bm {r ^ { ( t ) }} = \sigma ( w _ { r } \cdot h _ { (t - 1) } + u _ { r } \cdot x _ { t } + b_r) \;--\;(w_r, u_r, b_r)$

Extra Information（在 $t$ 时刻额外得到的信息）

$\bm {\tilde { c } ^ { ( t ) }} = tanh ( w _ { c } \cdot (r^{(t)} \circ h _ { (t - 1) }) + u _ { c } \cdot x _ { t } + b_c) \;--\;(w_c, u_c, b_c)$

Final hidden layer（通过那些信息计算 $h_t$ ）

$\bm {{ h } _ { t }} = (1-u^{(t)}) \circ h_{(t-1)} + u^{(t)} \circ \tilde { c } ^ { ( t ) }$

DamonDT

发布了57 篇原创文章 · 获赞 5 · 访问量 2888

私信关注

猜你喜欢

转载自blog.csdn.net/qq_34330456/article/details/99739269

【AI】_03_LSTM & GRU

GRU与LSTM

LSTM与GRU

LSTM & GRU

GRU and LSTM

LSTM 与 GRU

LSTM和GRU

GRU与LSTM总结

LSTM和GRU的区别

RNN-LSTM-GRU

RNN，LSTM和GRU

LSTM和GRU介绍

RNN、GRU、LSTM

图解LSTM和GRU

RNN - LSTM - GRU

LSTM 和GRU的区别

推荐系统与LSTM、GRU

LSTM 及 GRU 介绍

RNN, LSTM, GRU cells

GRU和LSTM比较

TextCNN/RCNN/LSTM/GRU

Pytorch_LSTM与GRU

RNN、LSTM、GRU笔记

RNN、LSTM、GRU

lstm和GRU推导

Pytorch：RNN、LSTM、GRU

【pytorch】LSTM | GRU使用

重温LSTM和GRU

详解RNN、LSTM、GRU

LSTM、GRU解析--笔记

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)