Non-local Neural Networks论文阅读

企业开发 2023-06-11 21:37:41 阅读次数: 0

文章目录

前言
一、Nolocal Block
二、代码
总结

前言

对于序列型数据，循环操作是长程依赖建模的主要解决方案。对于图像数据，通过深度卷积操作，卷积层堆叠形成大的感受野来建模长距离依赖关系。提出了nolocal block捕获远程依赖，将一个位置的响应计算为所有位置特征的加权和。
个人感觉就是self attention+短接（resnet）。

一、Nolocal Block

他们是把机器学习中的自注意力引入到计算机视觉中。根据定义，现根据key,query计算注意力系数，再把注意力系数与value相乘。C(x)是∑ ∀j f (xi, xj )，归一化（得出那个注意力系数）。
在这里插入图片描述
他们之后开始讨论f和g对结果的影响，答案是nolocal对f,g是什么并不敏感，就是整体的结果与f,g的关系很小。（大概一定程度上降低了设计难度吧，因为不怎么影响？）
g函数他们用线性函数参数为Wg，g(xj)=Wg·xj。
考虑双边滤波器和非局部均值（不知道为什么因为这个就必须是高斯函数），f选择高斯函数。扩展高斯函数就是把两个值先分别进入一个函数得到的结果再进入高斯函数。这里因为点积比较简单，就使用点积，不用欧氏距离。
C(x)是f(xi,xj)的对所有j的求和。
推导出来它的输出等于y = softmax(xT W T θ Wφx)g(x)，是softmax函数。由于这个softmax函数那么就不用按照self-attention从头到尾按公式敲代码了。可以进行简化。
还提出了一些变体。
最后定义non-local模块为
zi = Wz·yi + xi
yi是Eq.(1)的输出，xi是残差连接，Wz是可学习参数，如果初始化为0，那么将nolocal模块插入任何预训练模型不会破坏其初始行为。
在这里插入图片描述
实施过程中的技巧：

将Wg,Wθ,Wφ通道数设置为x中通道数的一半，最后输出用conv1x1x1进行通道数调节。
用x进行子采样后的x^计算（池化）。
非局部块的简单添加，对基线模型提供了结实的改进。

二、代码

总结

no-local block模块，把自注意力引入到视觉，应用全局信息，在video 分类上获得了很好的效果。2018年

猜你喜欢

转载自blog.csdn.net/goodenough5/article/details/129669793

【论文阅读】Non-local Neural Networks

Non-local Neural Networks论文阅读

Non-local Neural Networks

【论文翻译】Non-local Neural Networks

Non-local Neural Networks 笔记

（原）Non-local Neural Networks

【NL】《Non-local Neural Networks》

【论文笔记】Non-local Neural Networks

Non-local Neural Networks论文理解

论文笔记（9）：Non-local neural networks

阅读论文 Non-local Neural Networks（非局部神经网络）

读书笔记10：Non-local Neural Networks

「Deep Learning」Note on Non-local Neural Networks

ANN:Asymmetric Non-local Neural Networks for Semantic Segmentation

注意力之Non-local Neural Networks

论文笔记：Non-Local Neural Network

解耦Non-Local模块，比传统Non-Local提升1.5-3个点 | Disentangled Non-Local Neural Networks

[深度学习论文笔记][arxiv 1711] Non-local Neural Networks

注意力机制论文:Non-Local neural networks及其Pytorch实现

Non-Local Neural Networks--非局部神经网络

Non-local Neural Networks 原理详解及自注意力机制思考

【CV中的Attention机制】Non-Local neural networks的理解与实现

CVPR2020-AutoNL，超越FBNet、EfficientNet | Neural Architecture Search for Lightweight Non-Local Networks

Facebook何恺明等大神最新论文提出非局部神经网络（Non-local Neural Networks）

论文：GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyond 阅读笔记

non-local NN论文解读

论文笔记之Non-Local

超分辨论文阅读笔记：Non-local

18-Non-local-Neural-Networks

Residual Non-local Attention Networks for Image Restoration

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)