循环神经网络模型

其他 2019-01-23 10:31:00 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Solo95/article/details/86514357

整理并翻译自吴恩达深度学习系列视频：序列模型第一周，有所详略。

Recurrent Neural Network

在这里插入图片描述一个标准的循环神经网络如图所示，在网络的每一个时间步 $t$ ，它接受前一层的激活函数值 $a^{<t-1>}$ 和输入 $x^{<t>}$ ，使用权值矩阵使用 $W_{aa}$ 和 $W_{ax}$ 计算 $a^{<t>}$ ，使用结果 $a^{<t>}$ 和权值矩阵 $W_{ya}$ 计算 $\hat{y}^{<t>}$ ，计算方法如第二小节。

Forward Propagation

在这里插入图片描述
可总结为以下：
$a^{<t>}=g_1(W_{aa}a^{<t-1>}+W_{ax}x^{<t>}+b_a)$
$\hat{y}^{<t>}=g_2(W_{ya}a^{<t>}+b_y)$
$g_1$ 可以使用 $tanh$ 、 $ReLu$ ， $g_2$ 可以使用 $sigmoid$ 。

上图右边是向量化版本的实现，它将两个参数矩阵横向堆砌成 $[W_{aa}|W_{ax}]$ 构成 $W_a$ ，将两个输入纵向堆砌成 $[\frac{a^{<t-1>}}{x^{<t>}}]$ (横线表示分隔符不是除法)。

Backward Propagation

在这里插入图片描述
循环神经网络的反向传播同其他网络一致，按反方向计算导数，编程时框架会自动帮我们处理反向传播，但了解其基本原理也是有助益的。

如上图所示，需注意，每一个横向上的参数矩阵是共享的， $W_y、b_y$ 用于每次计算 $\hat{y^{<t>}}$ ， $W_a、b_a$ 也用于每次计算 $x^{<t>}$ 。

其损失函数使用的是交叉熵(cross entropy loss)。
$\mathcal{L}^{<t>}(\hat{y}^{<t>},y^{<t>})=-y^{<t>}log\hat{y}^{<t>}-(1-y^{<t>})log(1-\hat{y}^{<t>}))$
$\mathcal{L}(\hat{y}^{<t>},y)=\sum_{t=1}^{T}\mathcal{L}^{<t>}(\hat{y}^{<t>},y^{<t>})$

其他种类的RNN

在这里插入图片描述
根据输入和输出的对应关系，RNN有图示几种结构，即一对一、一对多、多对一、多堆多。

猜你喜欢

转载自blog.csdn.net/Solo95/article/details/86514357

循环神经网络模型

循环神经网络模型RNN

算法模型---循环神经网络

循环神经网络-语言模型

什么是循环神经网络模型？

基于循环神经网络（RNN）的神经语言模型

循环神经网络

神经网络——循环神经网络

神经网络模型

序列模型（5）-----双向神经网络（BRNN）和深层循环神经网络（Deep RNN）

《序列模型》之循环神经网络基础

使用循环神经网络实现语言模型

（tensorflow）使用循环神经网络模型预测正弦函数

循环神经网络三种经典模型

序列模型（2）-----循环神经网络RNN

视觉注意力的循环神经网络模型

序列模型汇总__循环神经网络（RNN）（一）

【深度学习模型】循环神经网络RNN

文本预处理 & 语言模型 & 循环神经网络基础

语言模型和循环神经网络（LM、RNNs）

（五）循环神经网络 -- 3 语言模型数据集

（五）循环神经网络 -- 2 循环神经网络

现代循环神经网络：双向循环神经网络

循环递归神经网络

循环神经网络实践

循环神经网络RNN

深层循环神经网络

RNN循环神经网络

简述循环神经网络

四、循环神经网络

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)