通过理解全连接神经网络理解了attention

其他 2020-01-22 13:25:48 阅读次数: 0

MLP
以往理解的全连接神经网络的作用，是个memory，是用来分类，

而近期发现，全连接神经网络其实是学到了 L层每个输入节点对 L+1层每个输出节点的加权求和贡献比，每个边是一个权重也就是一个输入节点到一个输出节点的贡献

其实就是attention

回想transformer里的K、V、Q，是可以把attention matrix看成全连接层的，
[batch,seq_len1,seq_len2] 矩阵乘 [batch,seq_len2,hidden_size] = [batch,seq_len1,hidden_size]
即attention matrix [batch, seq_len1, seq_len2]是在学输入的seq_len2个节点对输出的seq_len1个节点的加权求和贡献比

guotong1988

发布了1142 篇原创文章 · 获赞 196 · 访问量 260万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/guotong1988/article/details/103699542

通过理解全连接神经网络理解了attention

对于卷积神经网络中全连接层的理解

volatile理解了吗？

全连接神经网络 MLP

全连接神经网络

全连接神经网络实战

全连接神经网络的优化

什么是全连接神经网络？

直观理解神经网络最后一层全连接+Softmax

对神经网络的理解

神经网络的理解

通过keras例子理解LSTM 循环神经网络(RNN)

通过mnist数字识别理解卷积神经网络

浅谈 Attention 机制的理解

Attention Model 的理解

理解Attention机制

关于attention的简单理解

全连接神经网络学习（一）

反向传播算法推导-全连接神经网络

简单的全连接神经网络(tensorflow实现)

【Code】numpy、pytorch实现全连接神经网络

全连接神经网络的反向传播算法（BP）

全连接神经网络结构

Tensorflow--全连接神经网络

深度学习（一）- 全连接神经网络

3层全连接神经网络

深度学习开端-全连接神经网络

深度学习笔记(1)——全连接神经网络

Tensorflow 笔记 Ⅴ——mnist全连接神经网络

《Pytorch - BP全连接神经网络模型》

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

事务隔离级及脏读、幻读和不可重复读

rtos：zephyr同步信号量

把对象转换为JSON格式的数据

iOS Dev (56) iTunes Store 销售日报更新时间

Failed to start mongod.service: Unit not found;mongodb in unbuntu

Upgrading PHP on CentOS 6.5 (Final)

（四）王道机试指南___排版问题

TensorFlow之手写体识别

xcode xib报错 Safe Area Layout Guide Before IOS 9.0

【LeetCode】76. Minimum Window Substring（C++）

每日归档

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

通过理解全连接神经网络 理解了attention

猜你喜欢

通过理解全连接神经网络理解了attention