注意力机制之画图理解

1. 自己画图

  需要注意的是,模块都是算子。

  如果学习之后呢会发现,第一个图的Q、K、V和第二个图的Q、K、V是不同的。注意两者差异

在这里插入图片描述
在这里插入图片描述

2. 疑问

在这里插入图片描述
以Encoder为例,不同block之间传递了哪些参数?

おすすめ

転載: blog.csdn.net/weixin_47532216/article/details/121095293