FoveaBox 超越anchor based检测框架

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/cjnewstar111/article/details/94203397

目标检测系列文章
yolo v1原理:https://blog.csdn.net/cjnewstar111/article/details/94035842
yolo v2原理:https://blog.csdn.net/cjnewstar111/article/details/94037110
yolo v3原理:https://blog.csdn.net/cjnewstar111/article/details/94037828
SSD原理:https://blog.csdn.net/cjnewstar111/article/details/94038536
FoveaBox:https://blog.csdn.net/cjnewstar111/article/details/94203397
FCOS:https://blog.csdn.net/cjnewstar111/article/details/94021688
FSAF: https://blog.csdn.net/cjnewstar111/article/details/94019687

简介
FoveaBox是一个anchor free的目标检测框架,与FCOS比较类似
        
网络结构

如下图所示

       
可以看出FoveaBox和FCOS非常相似,经过FPN之后的特征图通过两个分支,一个预测类别,输出维度是H*W*C. 一个预测位置,输出维度是H*W*4。
在FCOS里面,会有一个Centerness的输出,用来剔除原理目标中中点的预测框。而在FoveaBox里面,增加了一个FovearArea的模块,在训练的时候,他将GT框往里收缩一定比例,作为正样本像素点(此区域就是图像的fovea area),将GT框往外扩展一定比例,然后之外的当做负样本像素点。中间的忽略。以此来减少远离中心点的预测,从而提高精度。总的来说FCOS使用的CentNess感觉更平滑一点,而且没有超参。FoveaBox需要自己调整正样本像素点和负样本像素点的矩形框比例。
        

实现细节:
如何处理重叠区域
这点和FCOS基本一致,就是在训练过程中将不同大小的GT按照一定的条件约束到不同的输出层。因为大部分重叠是大物体和小物体的重叠,所以就能比较好的将重叠局域区分开。
            
参考资料:
        机器之心:《最新Anchor-Free目标检测模型—FoveaBox》
        CSDN: 《论文学习 FoveaBox: Beyond Anchor-based Object Detector》

猜你喜欢

转载自blog.csdn.net/cjnewstar111/article/details/94203397