YoloV8改进策略:CoordConv给卷积加上坐标,从而使其具备了空间感知能力

摘要

传统卷积具备平移不变性,这使得其在应对分类等任务时可以更好的学习本质特征。但是,当需要感知位置信息时,传统卷积就有点力不从心了。为了使得卷积能够感知空间信息,作者在输入feature map后面增加了两个coordinate通道,分别表示原始输入的x和y坐标,然后再进行传统卷积,从而使得卷积过程可以感知feature map的空间信息,该方法称之为CoordConv。使用了CoordConv之后,能够使得网络可以根据不同任务需求学习平移不变性或者一定程度的平移依赖性。

在这里插入图片描述

论文链接:https://arxiv.org/pdf/1807.03247.pdf
GitHub:https://github.com/uber-research/CoordConv

CoordConv的构造如下图所示:
在这里插入图片描述

与传统卷积相比,CoordConv就是在输入的feature map后面增加了两个通道,一个表示x坐标,一个表示y坐标,后面就是与正常卷积过程一样了。

传统卷积具备三个特性:参数少、计算高效、平移不变性。而CoordConv则仅继承了其前两个特性,但运行网络自己根据学习情况去保持或丢弃平移不变性。看似这会损害模型的归纳能力,但其实拿出一部分网络容限能力去建模非平移不变性,实际上会提升模型的泛化能力。

事实上,如果Coor

猜你喜欢

转载自blog.csdn.net/m0_47867638/article/details/132570943