注意力机制的介绍

第二张图是错的, 文字可以参考


在这里插入图片描述
在这里插入图片描述
b t , t b^{t,t'} 也可以通过其它映射方式计算, 比如用 tanh 函数.
这里的 a t a^t 应该指的是 RNN 的输出, 而不是状态值或其他的.

发布了108 篇原创文章 · 获赞 7 · 访问量 4418

猜你喜欢

转载自blog.csdn.net/weixin_44795555/article/details/103055942