yolov5 FPN 与 PAN的结构与作用

在卷积神经网络过程中,网络层数越深,目标的特征信息就越强,模型对目标的预测就更好,但同时也会使得目标的位置信息越来越弱,并且在不断的卷积过程中,对小目标的信息容易造成损失,因此,需要进行不同尺度的预测。YOLOv5 采用 FPN 和 PAN的结构对特征进行多尺度融合。

下图为通过 FPN 和 PAN 对图像进行多尺度特征融合,其中上层特征图因为网络层数更深,包含的橙子语义信息也就更强,而下层特征因为经过的卷积层数较少,橙子的位置信息损失就更少,FPN 结构通过自顶向下进行上采样,使得底层特征图包含更强的图像强语义信息;PAN 结构自底向上进行下采样,使顶层特征包含图像位置信息,两个特征最后进行融合,使不同尺寸的特征图都包含图像语义信息和图像特征信息,保证了对不同尺寸的图片的准确预测。

猜你喜欢

转载自blog.csdn.net/m0_71816999/article/details/128955779
FPN