循环神经网络(RNN)是一类用来处理序列数据的神经网络。如卷积神经网络可以处理可变尺寸的网格数据一样,大多数循环神经网络可以处理可变长度的序列数据。
参数共享使得模型能够扩展到不同形式的样本(如不同长度的序列)并进行泛化。如果对于每个时间点都有一个独立的参数,那么我们不但不能泛化到训练时没见过过的序列长度,也不能在时间上共享不同序列长度和不同位置的统计强度。当信息的特定部分序列在序列内多个位置出现时,这样的共享尤为重要。
循环神经网络(RNN)是一类用来处理序列数据的神经网络。如卷积神经网络可以处理可变尺寸的网格数据一样,大多数循环神经网络可以处理可变长度的序列数据。
参数共享使得模型能够扩展到不同形式的样本(如不同长度的序列)并进行泛化。如果对于每个时间点都有一个独立的参数,那么我们不但不能泛化到训练时没见过过的序列长度,也不能在时间上共享不同序列长度和不同位置的统计强度。当信息的特定部分序列在序列内多个位置出现时,这样的共享尤为重要。