The Second-place Solution for CVPR VISION 23 Challenge Track 1 - Data Effificient Defect Detection

The Second-place Solution for CVPR VISION 23 Challenge Track 1 - Data Effificient Defect Detection
论文:https://arxiv.org/pdf/2306.14116.pdf
代码:https://github.com/love6tao/Aoi-overfitting-team

1 概述

该报告详细介绍了Aoi-overfifitting-Team团队在Data-Efficient Defect Detection Challenge中的技术细节。该挑战要求在有限的训练样本下对14个工业检测数据集进行实例分割。团队的方法主要关注在训练样本有限的情况下,如何提高缺陷掩码的分割质量。他们采用了基于混合任务级联(HTC)实例分割算法的变换器骨干(SwinB),并通过受CBNetv2启发的复合连接来增强基线结果。此外,团队还提出了两种模型集成方法,一种是将语义分割与实例分割相结合,另一种是采用多实例分割融合算法。最后,通过采用多尺度训练和测试时增强(TTA),团队在Data-Efficient Defect Detection Challenge的测试集上取得了显著的成绩,平均[email protected]:0.95超过48.49%,平均[email protected]:0.95为66.71%。
在这里插入图片描述

2 Approach

在这里插入图片描述

2-1 Base instance segmentation model

采用了在Imagenet-22k数据集上预训练的Swin-B网络作为我们的基础骨干网络。为了进一步提高性能,受到CBNetv2算法的启发,通过复合连接将两个相同的Swin-B网络进行组合。
在这里插入图片描述

2-2 Incorporating semantic segmentation into instance segmentation

接着,采用Mask2Former 训练了一个强大的语义分割模型,以进一步改善分割性能,并将语义分割的结果与实例分割的结果进行融合。这种融合的方法可以综合利用两种分割方法的优势,从而得到更准确和完整的分割结果。
在这里插入图片描述

2-3 Fusion of multiple instance segmentations

分别将HTC、级联Mask rcnn-ResNet50和级联Mask rcnn-ConvNext模型三个不同的分割模型,根据基于掩模的mAP的大小,给予模型不同的权重。具体而言,根据mAP的大小,给予模型的权重越高,从而最小化精度损失,提高分割的准确性。最后,还使用基于掩模IoU的非最大抑制(NMS)技术对所有经过置信度调整的模型检测结果进行进一步处理,以过滤掉冗余的检测结果。这种处理方式可以有效地去除重复的检测结果,提高分割算法的鲁棒性和准确性。
在这里插入图片描述

3 Experiments

在这里插入图片描述

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/shanglianlm/article/details/131911321