DETR介绍 - 代码天地

DETR介绍

其他 2022-07-05 14:33:02 阅读次数: 0

DETR是facebook发表于ECCV2020的使用Transformers进行端到端的目标检测的框架。

DETR只需要使用CNN提取图像特征，再单独使用Transformer就可以预测出目标边界框和分类。它不需要非极大值抑制，也不需要Anchor机制。

上图是DETR的网络架构图，DETR使用CNN提取图像特征，再单独使用Transformer得到预测出目标边界框，边界框和ground truth看作是一个几何预测问题。就是一个二分的匹配(bipartite matching)，没有匹配上的物体归位no object这一类。

上图是更详细的描述DETR的网络结构，图像经过CNN获取到特征，再加上位置编码(poositioonal encoding)，然后再展平送入到transformer encoder，encoder的输出再送入到transformer decoder，在decoder中还有object queries的输入，decoder的输出送入预测头(prediction heads)，预测头中有前馈神经网络FFN进行物体类别和边界框的预测。

上图是DETR中Transformer具体的架构，它有Encoder和Decoder两部分，Encoder的输入就是CNN提取的图像特征加上位置编码，送入多头自注意力模块，再送入前馈神经网络模块。这样的Encoder层可以有多个，然后再送入Decoder，Decoder有Object queries，是可学习的位置嵌入作为输入，经过多头自注意力模块，再经过Encoder和Decoder之间的多头互注意力模块，再送入前馈神经网络处理。Decoder层也可以堆叠多个，最后送入前馈神经网络FFN进行物体类别预测和边界框的预测。

{{o.name}}

{{m.name}}

猜你喜欢

转载自my.oschina.net/u/3768341/blog/5549321

DETR介绍

【DETR】

DETR、conditional DETR、Deformable DETR

SPARSE DETR

transformer and DETR

DETR详解

DETR~2

Anchor DETR

【DETR】DETR预测/推理代码

VisionTransformer[VIT]，DETR

DEFORMABLE DETR详解

Deformable detr源码分析

Efficient DETR 论文精读

目标检测：DETR详解

目标检测之DETR

Co-DETR

Focus-DETR

detr返回预测信息

深度学习（29）—— DETR

detr输出预测信息

DAB-DETR

Conditional DETR（ICCV 21）

Plain-DETR

Deformable DETR（2020 ICLR）

DEFORMABLE DETR学习笔记

DETR学习笔记

【DETR】DETR训练VOC数据集/自己的数据集

RT-DETR：可以满足实时性要求的DETR模型

Windows环境下调试DAB-DETR与Deformable-DETR

基于Transformer的目标检测DETR

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)