Training Recurrent Neural Network - 代码天地

Training Recurrent Neural Network

其他 2018-08-14 14:18:32 阅读次数: 0

目录

Clipping the gradients

Advanced optimization technology

NAG (NAG是Momentum的进化版)

RMSprop (RMSprop是Adagrad进化版)

Try LSTM (or other variants)

Better initialization

链接：

http://speech.ee.ntu.edu.tw/~tlkagk/courses/MLDS_2015_2/Lecture/RNN%20training%20(v6).pdf

Problem

the error surface is rough

误差表面凹凸不平，可能上一步很高，下一步就会跌得很深。RNN就是一个很深的DNN，在第二张图可以知道，对于RNN来说使用Relu并不是一个比较好的结果，一般采取的激活函数是tanh或者sigmoid。而且这个输出的值也是可大可小。

Clipping the gradients

为了解决凹凸不平的悬崖问题，我们让飞出去的gradient，设定一个阈值，超过了就只能在这个值范围内。如果在悬崖边，我们也可以向前多走一步。

Advanced optimization technology

NAG (NAG是Momentum的进化版)

RMSprop (RMSprop是Adagrad进化版)

其实RMSProp的形式和Adagrad差不多，不同之处在于过去的gradient会乘以一个权值，越向前对当前的gradient影响越小。

Try LSTM (or other variants)

LSTM can address the gradient vanishing problem.

RNN和LSTM对待Memory的本质不同导致了LSTM能够解决梯度消失问题。在LSTM的加法计算中，微分为1；在乘法计算中，如果forget gate=1，一路畅通无阻（常数），所以微分为Constant Error Carrousol (CEC)，红色箭头为error signal，由CEC可知，error signal的值保证不会小，但是不能保证太大，所以不能够解决梯度爆炸问题；而且由绿线可知，XWT可大可小，可小无所谓，error signal本来就很大。但是如果XWT很大，就会出现梯度爆炸的问题。

其他的变形：

GRU: Cho, Kyunghyun, et al. "Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation“, EMNLP, 2014.

SCRN: Mikolov, Tomas, et al. "Learning longer memory in recurrent neural networks“, ICLR 2015.

Better initialization

猜你喜欢

转载自blog.csdn.net/qq_18124075/article/details/81191290

Training Recurrent Neural Network

Recurrent Neural Network

Independently Recurrent Neural Network

Recurrent Neural Network(1):Architecture

A RECURRENT NEURAL NETWORK WITHOUT CHAOS

Deep Neural Network Training

Tips for Training Deep Neural Network

Recurrent Neural Network（递归神经网络）

【NLP】Recurrent Neural Network and Language Models

神经网络（Recurrent Neural Network，RNN）

Recurrent neural network (RNN) - Pytorch版

循环神经网络（Recurrent Neural Network）

Implementing Recurrent Neural Network from Scratch

Recurrent Neural Network(递归神经网络）

On the difficulty of training Recurrent Neural Networks中RNN完美复现

Learn Note05--Neural Network Training

论文《Chinese Poetry Generation with Recurrent Neural Network》阅读笔记

Building a Recurrent Neural Network Step by Step--[0]

RNN（Recurrent Neural Network）循环神经网络

循环神经网络：RNN（Recurrent Neural Network）

tensoflow练习2：利用Recurrent Neural Network 进行分类

循环神经网络（Recurrent Neural Network，RNN）

AI（008） - 循环神经网络（Recurrent Neural Network）

【Recurrent Neural Network Regularization】读后感（未编辑完毕）

Quasi Recurrent Neural Network （qrnn）（git待更新...）

循环神经网络（Recurrent Neural Network, RNN）

Recurrent Neural Network for Text Classification with Multi-Task Learning

论文笔记：DRAW: A Recurrent Neural Network For Image Generation

什么是循环神经网络 RNN (Recurrent Neural Network)

自然语言处理之----RNN(Recurrent Neural Network)

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)