动手学深度学习——循环神经网络 - 代码天地

动手学深度学习——循环神经网络

其他 2020-04-21 13:38:47 阅读次数: 0

循环神经网络

循环神经网络（RNN）主要用于预测任务：基于当前和历史输入序列，预测序列的下一个字符。循环神经网络相对于普通神经网络而言，最大的特点在于颖仓变量 $H$ 的引进，用 $H_{t}$ 表示 $H$ 在时间步 $t$ 的值，该变量记录了到当前字符为止的序列信息。历史信息的使用使得预测更为精确。循环神经网络的示意图：
在这里插入图片描述

循环神经网络模型

假设 $\boldsymbol{X_{t} \in \mathbb{R}^{n \times d}}$ 是时间步 $t$ 的小批量输入， $\boldsymbol{H_{t} \in \mathbb{R}^{n \times h}}$ 是该时间步的隐藏变量，则：
$\boldsymbol{H_{t}}=\Phi(\boldsymbol{X_{t}}\boldsymbol{W_{xh}}+\boldsymbol{H_{t-1}}\boldsymbol{W_{hh}}+\boldsymbol{b_{h}})$

其中 $\boldsymbol{W_{xh} \in \mathbb{R}^{d \times h}}$ ， $\boldsymbol{W_{hh} \in \mathbb{R}^{h \times h}}$ ， $\boldsymbol{b_{h} \in \mathbb{R}^{1 \times h}}$ ， $\Phi$ 函数是非线性激活函数。由于引入了 $\boldsymbol{H_{t-1}}\boldsymbol{W_{hh}}$ ， $\boldsymbol{H_{t}}$ 能够捕捉截至当前时间步的序列的历史信息，就像是神经网络当前时间步的状态或记忆一样。循环神经网络的展开式示意图如下所示：
在这里插入图片描述
在时间步，输出层的输出为：
$\boldsymbol{O_{t}}=\boldsymbol{H_{t}}\boldsymbol{W_{hq}}+\boldsymbol{b_{q}}$

其中 $\boldsymbol{W_{hq} \in \mathbb{R}^{d \times h}}$ ， $\boldsymbol{b_{q} \in \mathbb{R}^{1 \times q}}$ 。

注：上述来源于伯禹学习平台的《动手学深度学习》的学习笔记

伸腿瞪眼丸

发布了19 篇原创文章 · 获赞 17 · 访问量 1464

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43839651/article/details/104318614

动手学深度学习之循环神经网络

动手学深度学习——循环神经网络

《动手学深度学习》-55循环神经网络

MXNet动手学深度学习笔记：循环神经网络RNN实现

动手学深度学习(第六章循环神经网络)

动手学深度学习-循环神经网络进阶（ModernRNN）

动手学深度学习（七、语言模型与循环神经网络）

李沐动手学深度学习V2-RNN循环神经网络原理

【动手学深度学习】李沐——循环神经网络

动手学深度学习——卷积神经网络3

动手学深度学习——卷积神经网络1

动手学深度学习（六、卷积神经网络）

《动手学深度学习》——线性神经网络

《动手学深度学习——卷积神经网络、LeNet、卷积神经网络进阶》笔记

长短期记忆网络 LSTM 深层循环神经网络 Deep RNN 双向循环神经网络 Bidirectional RNN 动手学深度学习v2

ElitesAI·动手学深度学习PyTorch版学习笔记-文本预处理；语言模型；循环神经网络基础

《动手学深度学习》笔记 Task02：文本预处理；语言模型；循环神经网络基础

循环神经网络 RNN 从零开始实现动手学深度学习v2 pytorch

李沐动手学深度学习V2-使用Pytorch框架实现RNN循环神经网络

李沐动手学深度学习V2-双向循环神经网络Bidirectional RNN和代码实现

动手学pytorch-循环神经网络进阶

深度神经网络分布式训练动手学深度学习v2

CNN深度卷积神经网络 AlexNet 动手学深度学习v2 pytorch

《动手学深度学习 Pytorch版》 7.1 深度卷积神经网络(LeNet)

动手学习深度学习 | 语言模型和循环神经网络笔记

《动手学深度学习》笔记 Task05：卷积神经网络基础；leNet；卷积神经网络进阶

动手深度学习之从线性回归到循环神经网络

动手深度学习 task2(文本预处理+语言模型+循环神经网络）

MXNet动手学深度学习笔记：GoogLeNet神经网络实现

MXNet动手学深度学习笔记：VGG神经网络实现

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)