目标检测系列论文：DiffusionDet（一）：论文概述

企业开发 2023-07-11 20:45:05 阅读次数: 0

解决什么问题

解决的是目标检测的任务
目标检测任务往往需要借口任务来进行帮助，但是作者说他不需要，他这个思路比较直接（我觉得这里就是作者强找的一个创新，但是我也不是研究目标检测的实在是没看懂）
主要的创新点应该还是diffusion用在目标检测的第一篇

怎么生成

谈到diffusion怎么生成，其实主要还是两个方面：

1.怎么控制
2.从什么出发

怎么控制？

这里是目标检测，自然需要图像信息控制，图像信息提取有很多成熟的手段自然可以直接使用，例如作者提到的swim—transformer。

从什么出发？（本文重点）

我认为这是本文重点：
作者是从一堆随机框出发的：

1.这里我们注意一个细节，作者并不是真正的和原始的diffusion一样把这个照片整个扩散成噪声。而是把这个图片当中一个或是真实的框扩散成一堆随机的框，之后做训练。反过来，做预测的时候则是随机的在这个图片上撒上去一堆随机的框再通过网络恢复成真实的框。
2.diffusion是从随机的噪声里面得到一个真实的内容，那么自然是想要找什么就从什么里面找，找随机框就从随机框堆里面（一堆，可以不固定）找真整的框组（一个或是几个）
3.目标空间指的是一个有四个维度的空间：目标框中心坐标（2）、目标框长宽（2）；

结果具有什么优势

1.这个东西训练时候的生成的噪声框和训练时候输入的噪声框的数量分布可以不同，因此有很好的自由性（diffusion都有这个效果，基于的是噪声和噪声之间是相同的认知）；
2.可以通过改变diffusion从真值到噪声的轮数，来平衡需求当中开销限制和精确度要求（这个其实所有的diffusion都有类似功效）

启示

主要的启示是作者提出的从一堆随机框子生成真正的框子的事情，就是diffusion并不是都应该来自于噪声图片，而是你必须想清楚你的目标结果是什么空间。你的目标是图片自然是从噪声图片出发，还是得考虑清楚生产什么东西。

猜你喜欢

转载自blog.csdn.net/qq_43210957/article/details/128500448

目标检测系列论文：DiffusionDet（一）：论文概述

目标检测YOLO系列论文对比

（一）论文阅读 | 目标检测之CornerNet

目标检测论文整理

目标检测相关论文

视频目标检测论文

深度学习目标检测系列论文阅读和Pytorch实现(一)

目标检测论文综述（三）One-Stage（YOLO系列）

目标检测YOLOv7系列算法模型-论文详解

目标检测DiffusionDet: Diffusion Model for Object Detection

【论文阅读】DiffusionDet: Diffusion Model for Object Detection

目标检测DET | FPN论文

【论文阅读】目标检测综述

目标检测论文合集链接

目标检测-论文汇总

目标检测：SaccadeNet论文解读

【目标检测】YOLOF论文粗读

深度学习目标检测系列论文阅读和Pytorch实现(二)——SSD论文阅读

深度学习目标检测系列论文阅读和Pytorch实现(四)——FCN论文阅读

经典论文重读---目标检测篇（一）：RCNN

【目标检测】对RCNN论文的一些理解

【目标检测】对SPPNet论文的一些理解

目标检测论文综述（一）深度卷积神经网络

[论文阅读笔记18] DiffusionDet论文笔记与代码解读

【目标检测】【DDPM】DiffusionDet:用于检测的概率扩散模型

ECCV 2020 目标检测论文大盘点（49篇论文）

目标检测：YOLOV3论文解读

目标检测-部分cvpr2018论文

图像目标检测 | RFCN 论文解析（1）

【转载】目标检测之SSD论文详解

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)