LSTM训练详解

我们知道RNN在训练过程中会出现梯度消失的问题,主要原因在于t时刻并未保存状态信息,LSTM最大的改进在于引入各种门结构,从而保存中间状态信息,有效解决了梯度消失的问题。我觉得深度学习理解的难点在于整个训练过程,因此训练过程懂了,算法基本就ok了,我也是在看了很多其他博主写的文章之后一点点去解决了自己的疑惑。

有空再写,想要真正了解训练过程,把整个训练过程推导一遍基本就ok了

猜你喜欢

转载自blog.csdn.net/cuipanguo/article/details/82144657