pytorch_08_RNN

1.循环神经网络的提出是基于记忆模型的想法，期望网络能够记住前面出现的特征，并依据特征推断后面的结果，而且整体的网络结构不断循环，因而得名循环神经网络。

2.循环神经网络的基本结构特别简单，就是将网络的输出保存在一个记忆单元中，这个记忆单元和下一次的输入一起进入神经网络中。

3.使用双向循环神将网络，网络会先从序列的正方向读取数据，再从反方向读取数据，最后将网络输出的两种结果合在一起形成网络的最终输出结果。

4.解决长时依赖的问题：LSTM,GRU

LSTM(1997):长的短时记忆网络

LSTM由三个门来控制，这三个门分别是输入门，遗忘门和输出门。输入门控制者网络的输入，遗忘门控制者记忆单元，输出门控制者网络的输出。其中最重要的是遗忘门，遗忘门的作用是决定之前的哪些记忆被保留，哪些记忆将被去掉，正是遗忘门的作用，使得LSTM具有长时记忆的功能，对于给定的任务，遗忘门能够自己学习保留多少以前的记忆，这使得不需人为干扰，网络能够自主学习。

LSTM流程：

C_t-1作为上一步t-1时刻网络中的记忆单元，传入t时刻的网络之后，第一步操作是决定它的遗忘程度，将t时刻前面的记忆状态乘上一个0-1的系数进行衰减，接着加上t时刻学到的记忆作为更新之后的记忆传出网络，作为t+1时刻的网络的记忆单元。其中t-1时刻网络记忆的衰减系数是通过t时刻网络的输入和t-1网络输出来确定的，t时刻网络学到的记忆也是根据t时刻网络的输入和t-1时刻网络的输出得到的。

遗忘门：

首先将 t-1 时刻的网络输出h_t-1和这一步的输入xt结合起来，然后作用线性变换W_f*[h_t-1,x_t]+b_f。再经过sigmoid激活函数，将结果映射到0-1作为记忆的衰减系数，记作ft，可以看到网络具体要保留多少记忆是由前一时刻的输出和这一时刻的输入共同决定的。

衰减系数：