手推RNN(第二部) - 代码天地

手推RNN(第二部)

编程语言 2019-02-19 23:00:50 阅读次数: 0

接着上一篇RNN的推导,我们这次来理解LSTM的原理的推导过程.

LSTM的由来这里简而概之,保留该保留的,忘记该忘记的,不懂的人可以百度一下,因为比较简单这里不再概述.

在Alex Graves的这篇论文《Supervised Sequence Labelling with Recurrent Neural Networks》中对LSTM进行了综述性的介绍，并对LSTM的Forward Pass和Backward Pass进行了公式推导。

本博文是根据LSTM的公式推导详解这篇翻译进行总结和整理(部分内容可能有问题,加了自己的观点),由于看外文太麻烦了,索性投机取巧了~~

LSTM的结构图如下:

LSTM简图

剖析图(/home/wjy/Desktop/123.png)

没有看原论文,个人感觉这里有问题,从下面的公式推导来看,这里的图少了一点:当前cell和下一个cell之间传递,现将自己改动的图放在下面

修改后的图

前向传播

就是结构复杂一点,其他的都差不多,自己动手退一下就好

前向传播

反向传播

权重示意图

这里得注意一下我刚开始画的那条线,不然的话中间推导起来有点麻烦.

反向传播主要是看反向传播线,找到当前需要求解的梯度值,然后找与之相对应的反向传播线即可,

这里给出一个最难求解的CELL端的反向传播的分析例子,其它的自己动手理一下就好.

Cell梯度求解示意图

首先找到cell与之相连的反向传播线,这里我们找到是四个

下一时刻的Output Gate

当前时刻的Cell Output

下一时刻的Input Gate

下一时刻的Forget Gate

分析完这些之后那就进行链式求导法则

Cell梯度图

全部反向梯度图

总结

LSTM就是RNN的加深,就像刚开始我说的:保留该保留的,忘记该忘记的,

推导的过程要屡清楚传递线路

熟悉链式求导法则

就这样了,理论和实践还有很大差距,接下来我会用例子带你进入RNN的奇妙之旅

参考文献

RNN推导的挺好的,就是没图片

RNN推导参考之一

LSTM文章简介,没有公式推导

外国大神的论文,来自中国大神的翻译,非常棒

手写RNN代码

猜你喜欢

转载自blog.csdn.net/weixin_33953384/article/details/87428849

手推RNN(第二部)

项目二第二部

第二部分

AJAX第二部

参考手册目录__第二部分

[原译]Lambda高手之路第二部分

mysql8学习手册第二部分用户管理

c语言指针一览第二部分（新手向）

Hadoop第二部分：MapReudce(二)

IOC装配Bean(第二部分)

Django学习篇（第二部）

第二部分：cxf开发webservice

第二部分工具库

Storyboard全解析-第二部分

第二部分练习

偶像崇拜：第二部分

GIS CAD转换的第二部分

【重点】第二部分：进程原理

spring学习笔记（第二部分）

defaultdict(list) （第二部分）

sqlalchemy第二部分

Structs复习 Result第二部分

python第二部分

QT学习第二部：简单的串口工具

Spring Ioc 第二部分

Spark Streaming 第二部分

Hello Quartz (第二部分)

【python核心编程第二部】7.14

部署 Job (第二部分)

常用SQL第二部分

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

面试爱奇艺，竟然挂在第5轮……

scala方法和函数的区别

NYIST--2018大一新生第一次周赛题解

java如何通过client客戶端http实现get/ post请求传递json参数到restful 服务接口

RabbitMQ 队列类型

2018-2019-1 20165311 20165329 20165334 实验一开发环境的熟悉

iOS打包工具配置相应的文件路径一键打包到指定位置

【每日一题】替换空格

【转载】FPGA配置方式

旅行青蛙

每日归档

更多

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)