深度/机器学习基础知识要点：RNN、LSTM、GRU - 代码天地

深度/机器学习基础知识要点：RNN、LSTM、GRU

其他 2020-08-10 10:14:55 阅读次数: 0

RNN(循环神经网络)

RNN示意图

$x$ 是一个向量，它表示输入层的值； $s$ 是一个向量，它表示隐藏层的值； $U$ 是输入层到隐藏层的权重矩阵； $o$ 也是一个向量，它表示输出层的值； $V$ 是隐藏层到输出层的权重矩阵。循环神经网络的隐藏层的值 $s$ 不仅仅取决于当前这次的输入 $x$ ，还取决于上一次隐藏层的值 $s$ 。权重矩阵 $W$ 就是隐藏层上一次的值作为这一次的输入的权重。

输出值 ${o}_{t}$ ，是受前面历次输入值 ${x}_{t}、{x}_{t-1}、{x}_{t-2}$ 、…影响的，这就是为什么循环神经网络可以往前看任意多个输入值的原因。
计算公式：
双向循环神经网络
- 示意图
- 计算公式：

LSTM（长短时记忆网络）

单元状态(cell state)

新增加的状态c，称为单元状态(cell state)。我们把上图按照时间维度展开：

在t时刻，LSTM的输入有三个：当前时刻网络的输入值 $x_t$ 、上一时刻LSTM的输出值 $h_{t-1}$ 、以及上一时刻的单元状态 $c_{t-1}$ ；
LSTM的输出有两个：当前时刻LSTM输出值 $h_{t}$ 、和当前时刻的单元状态 $c_{t}$ 。

用到了门（gate）的概念。门实际上就是一层全连接层，它的输入是一个向量，输出是一个0到1之间的实数向量。

LSTM用两个门来控制单元状态c的内容，一个是遗忘门（forget gate），它决定了上一时刻的单元状态 ${c}_{t-1}$ 有多少保留到当前时刻 ${c}_{t}$ ；另一个是输入门（input gate），它决定了当前时刻网络的输入 ${x}_{t}$ 有多少保存到单元状态 ${c}_{t}$ 。LSTM用输出门（output gate）来控制单元状态 ${c}_{t}$ 有多少输出到LSTM的当前输出值 ${h}_{t}$ 。

LSTM需要学习的参数共有8组，分别是：遗忘门的权重矩阵 ${W}_{f}$ 和偏置项 ${b}_{f}$ 、输入门的权重矩阵 ${W}_{i}$ 和偏置项 ${b}_{i}$ 、输出门的权重矩阵 ${W}_{o}$ 和偏置项 ${b}_{o}$ ，以及计算单元状态的权重矩阵 ${W}_{c}$ 和偏置项 ${b}_{c}$ 。

LSTM单元结构：
- 遗忘门：
- 输入门：
- 用于描述当前输入的单元状态，它是根据上一次的输出和本次输入来计算的：
- 当前时刻的单元状态
- 输出门
- LSTM最终的输出

GRU

GRU 是LSTM 的一个变体，GRU 保持了 LSTM 的效果同时又使结构更加简单。

GRU 只剩下两个门，即更新门和重置门。

更新门
用于控制前一时刻的状态信息被代入到当前状态的程度，更新门的值越大说明前一时刻的状态信息带入越多。
重置门
用于控制忽略前一时刻的状态信息的程度，重置门的值越小说明忽略得越多。
GUR单元结构

猜你喜欢

转载自blog.csdn.net/zengNLP/article/details/104135185

深度/机器学习基础知识要点：RNN、LSTM、GRU

【深度学习】RNN | GRU | LSTM

[深度学习]理解RNN, GRU, LSTM 网络

深度学习笔记——RNN（LSTM、GRU、双向RNN）学习总结

深度/机器学习基础知识要点：Matrix Factorization

深度/机器学习基础知识要点：CNN、ResNet、DenseNet

深度/机器学习基础知识要点：HMM、MEMM、CRF

深度/机器学习基础知识要点：TFIDF、LDA、LSA

深度/机器学习基础知识要点：CTC算法

循环神经网络(RNN)及其变体GRU和LSTM的基础知识详解(公式)

深度学习的基础知识(RNN、LSTM等模型、激励函数、正则化、norm batch)

深度学习基本知识介绍、CNN/RNN/LSTM/GRU神经网络原理

深度学习基础：RNN与LSTM

深度学习：循环神经网络（RNN）的变体LSTM、GRU

深度学习----从RNN 到 LSTM 再到进化 GRU

深度学习实战——循环神经网络（RNN、LSTM、GRU）

RNN、LSTM与GRU学习笔记

RNN、LSTM、GRU学习补充

TensorFlow之RNN：堆叠RNN、LSTM、GRU及双向LSTM 深度学习之循环神经网络（RNN）循环神经网络之LSTM和GRU 》

深度/机器学习基础知识要点：SVM、Clustering、LR、GBDT

RNN、LSTM、GRU基础原理篇

深度学习-机器学习基础知识

RNN-LSTM-GRU学习笔记

深度学习--RNN，LSTM

【深度学习】rnn and lstm

RNN-LSTM-GRU

RNN，LSTM和GRU

RNN、GRU、LSTM

RNN - LSTM - GRU

RNN, LSTM, GRU cells

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)