门控循环单元 GRU 动手学深度学习v2

1. 门控循环单元 GRU

在这里插入图片描述
不是每个元素都很重要,比如猫重复了很多次,只有第一次看到猫才比较重要,其它的猫可以被忘记掉。老鼠只出现一次,但也是很重要的。
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2. 代码实现

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
简洁实现
在这里插入图片描述

3. Q&A

    1. GRU相比RNN多了很多参数,但是GRU比RNN更稳定,也就是不会导致梯度爆炸。
    1. RNN在长文本的时候效果不好,所以用GRU,LSTM效果会比较好,能做到100左右。超过100可以用BERT。

参考

https://www.bilibili.com/video/BV1mf4y157N2?p=1

猜你喜欢

转载自blog.csdn.net/zgpeace/article/details/124679799
今日推荐