金字塔池化视觉Transformer！ - 代码天地

金字塔池化视觉Transformer！

企业开发 2022-05-13 05:54:18 阅读次数: 0

点上方人工智能算法与Python大数据获取更多干货

在右上方 ··· 设为星标 ★，第一时间获取资源

仅做学术分享，如有侵权，联系删除

转载于：CVer

P2T: Pyramid Pooling Transformer for Scene Understanding

作者单位：南开大学，阿里巴巴

论文：https://arxiv.org/abs/2106.12011

代码：https://github.com/yuhuan-wu/P2T

本工作解决了视觉transformer中的两大问题：

1) 传统的Multi-Head Self-Attention (MHSA) 需要大量的计算、空间资源。

2) 最近新提出的视觉transformer在图像分类中被过度地开发和调整，却忽视了图像分类（单一场景，与MLP较为相似）和各类下游场景理解任务（复杂场景，丰富结构和内容信息）的区别。

具体而言，本文注意到pyramid pooling因其强大的抽象上下文能力在各类视觉任务上的表现都十分出色，且其空间不变性的自然属性适合解决结构信息的丢失问题（问题2）。本文第一次将pyramid pooling引入到视觉transformer中，从而减少使用传统MHSA带来的过高计算量和存储空间（问题1）。

通过将基于pyramid pooling的P-MHSA嵌入到transformer内，本文构建了一个下游任务导向的视觉transformer，本文将其命名为pyramid pooling transformer (P2T)。

为了证明P2T的有效性，本文还在语义分割、目标检测、实例分割、显著性物体检测等多个任务与多种方法进行对比，结果显示P2T在多种下游任务上都展现了其显著的卓越性。

语义分割

在ADE20K validation set上的对比结果

在Cityscapes validation set上的对比结果

目标检测

在COCO val2017上的对比结果

PASCAL VOC 2007上的对比结果

实例分割

在COCO val2017上的对比结果

显著性物体检测

在DUTS-TE、DUT-OMORN、PASCAL-S数据集上的对比结果

图像分类

虽然本文设计的P2T并未针对图像分类进行设计，但仍然在ImageNet-1K取得了极强竞争力的结果。

---------♥---------

声明：本内容来源网络，版权属于原作者

图片来源网络，不代表本公众号立场。如有侵权，联系删除

AI博士私人微信，还有少量空位

如何画出漂亮的深度学习模型图？

如何画出漂亮的神经网络图？

一文读懂深度学习中的各种卷积

点个在看支持一下吧

猜你喜欢

转载自blog.csdn.net/qq_15698613/article/details/118919700

金字塔池化视觉Transformer！

金字塔池化笔记

SPPNet——空间金字塔池化

空间金字塔池化SPP

用于视觉识别的深度卷积网络空间金字塔池化方法

《空间金字塔池化》论文笔记

空间金字塔池化SPP（Spatial Pyramid Pooling）

目标检测（3）-空间金字塔池化（SPP）

空间金字塔池化（Spatial Pyramid Pooling，SPP）

SPP Net 空间金字塔池化原理

金字塔池化系列的理解SPP、ASPP

SPPNet(空间金字塔池化)与RoI Pooling

SPP-net：空间金字塔池化

多尺度检测（特征金字塔）（空间金字塔池化）（融合多层信息）的好处

机器视觉中的图像金字塔

深度学习基础--池化--空间金字塔池化(spatial pyramid pooling,SPP)

自动化金字塔

基于空间金字塔池化的卷积神经网络物体检测

目标定位和检测系列（4）：金字塔池化（SPP-net）

卷积神经网络物体检测---空间金字塔池化的

卷积神经网络—SPPNet(空间金字塔池化)

Spatial Pyramid Pooling（空间金字塔池化）-变尺度CNN训练

空间金字塔池化SPP改进RCNN的重要思想

SPP-net详解(金字塔池化）（附代码实现）

基于卷积神经网络和时域金字塔池化的语音情感分析

SPPNet-引入空间金字塔池化改进RCNN

ASPP 空洞空间卷积池化金字塔(atrous spatial pyramid pooling )

深度学习-空间金字塔池化(Spatial Pyramid Pooling SPP)

Yolov5调整空间金字塔池化SPPCSPC/上采样方式bilinear

空间金字塔池化（SPP，Spatial Pyramid Pooling)系列

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)