目标检测算法的大体框架-------backbone、head、neck

在基于深度学习算法的目标检测算法其实大体上都是由三部分组成的,即backbone、head、neck。整个算法的设计流程基本都是:输入->backbone->neck->head->输出。

1、具体含义
backbone
    骨干网络也称为主干网络,主要用于特征提取,提取不同尺度、不同感受野下、不同类别的目标特征,以满足目标检测;
head
    检测头,主要用于预测目标的种类和位置(bounding boxes);
neck
    一般翻译成“瓶颈”或是“脖子”,这个翻译总感觉有些问题,此结构主要是将backbone上的多个层级的特征图进行融合加工,增强网络的表达能力,同时,neck决定了head的数量,决定了不同尺度的样本如何分配到不同的head;

2、常用结构
backbone主要包括:
    VGG、ResNet(ResNet18,50,100)、ResNeXt、DenseNet、SqueezeNet、Darknet(Darknet19,53)、MobileNet、ShuffleNet、DetNet、DetNAS、SpineNet、EfficientNet(EfficientNet-B0/B7)、CSPResNeXt50、CSPDarknet53;
head
    one-stage:RPN、SSD、YOLO、RetinaNet、CornerNet、CenterNet、MatrixNet、FCOS;
    two-stage:Faster R-CNN、R-FCN、Mask RCNN (anchor based)、RepPoints(anchor free);
neck
    SPP、ASPP、RFB、FPN、NAS-FPN、Fully-connected FPN、BiFPN等;

转载至:https://blog.csdn.net/guzhao9901/article/details/120676467

猜你喜欢

转载自blog.csdn.net/qq_44666320/article/details/127410233