deformable detr中的sampling_offsets初始化grid_init方式 - 代码天地

deformable detr中的sampling_offsets初始化grid_init方式

企业开发 2023-07-11 18:03:06 阅读次数: 0

deformable detr中根据参考点预测4个采样点，采样点网络是

self.sampling_offsets = nn.Linear(
            embed_dims, num_heads * num_levels * num_points * 2)

它有个更新linear层偏置的过程

def init_weights(self):
    """Default initialization for Parameters of Module."""
    constant_init(self.sampling_offsets, 0.)
    thetas = torch.arange(self.num_heads, dtype=torch.float32) * (2.0 * math.pi / self.num_heads)
    grid_init = torch.stack([thetas.cos(), thetas.sin()], -1)
    grid_init = (grid_init / grid_init.abs().max(-1, keepdim=True)[0]).view(self.num_heads, 1, 1, 2).repeat(1,
                                                                                                            self.num_levels,
                                                                                                            self.num_points,
                                                                                                            1)
    for i in range(self.num_points):
        grid_init[:, :, i, :] *= i + 1

    self.sampling_offsets.bias.data = grid_init.view(-1)
    xavier_init(self.value_proj, distribution='uniform', bias=0.)
    self._is_init = True

这个bias起什么作用呢？经过调试，我发现它初始化后8个head的grid是[8,1,4,2]，是这个样子

把它画在一个二维坐标系中后，8个head是这个样子

而sample point坐标=W*input+bias，W初始化为0~1之间的一个很小的数字，所以最终采样坐标很大程度上是bias起作用。那么意思就很明显了，这是想让8个头在以参考点为中心的8个射线方向上做采样。

取一组样本，经过如下前传过程，

sampling_offsets = self.sampling_offsets(query).view( sample offsets
            bs, num_query, self.num_heads, self.num_levels, self.num_points,

输出为

画了几个head的采样点，如下：

可以看到，黑色集中在y轴正向，红色集中在x轴正向，蓝色集中在y=x正向。

所以最终结论：采样偏移层的bias的作用就是为了让采样点更均匀的分布在参考点reference_points周围。

猜你喜欢

转载自blog.csdn.net/qq_42897796/article/details/127588009

deformable detr中的sampling_offsets初始化grid_init方式

Deformable detr源码分析

DEFORMABLE DETR详解

Deformable DETR（2020 ICLR）

DEFORMABLE DETR学习笔记

DETR、conditional DETR、Deformable DETR

Deformable DETR 实战（训练及预测）

Deformable DETR模型学习记录

BEVFormer --- 来自于Deformable DETR

TensorRT加速Deformable Detr实践

目标检测——deformable detr论文解读【DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION】

Deformable DETR环境配置和应用

Deformable-DETR代码学习笔记

两阶段Deformable-DETR中decoder的content_query & pos_query初始化

论文精读:DEFORMABLE DETR: DEFORMABLE TRANSFORMERSFOR END-TO-END OBJECT DETECTION

【Deformable DETR 论文+源码解读】Deformable Transformers for End-to-End Object Detection

目标检测——【Transformer】DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION

论文阅读笔记9-Deformable DETR: Deformable Transformers for end-to-end object detection

Deformable-DETR(two-stage version)中Encoder Proposal

Windows环境下调试DAB-DETR与Deformable-DETR

目标检测算法——deformable-detr源码调试

Deformable DETR进行目标检测，解决size mismatch问题

DAB-Deformable-DETR代码学习记录之模型构建

Deformable CONV

mmet中deformable detr 报错 AssertionError: The `num_classes` (3) in DeformableDETRHead of...

计算机视觉算法——基于Transformer的目标检测（DETR / Deformable DETR / DETR 3D）

DEFORMABLE DETR: DEFORMABLE TRANSFORMERS FOR END-TO-END OBJECT DETECTION——用于端到端物体检测的可变形注意力机制

目标检测算法——mmdetection下面的deformable-detr运行

DAB-Deformable-DETR源码学习记录之模型构建（二）

Deformable-detr在运行make.sh文件时，报NotImplementedError: Cuda is not availabel

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)