[深度学习从入门到女装]RDSNet: A New Deep Architecture for Reciprocal Object Detection and Instance Segmentatio

论文地址:RDSNet: A New Deep Architecture for Reciprocal Object Detection and Instance Segmentation

一篇挺有意思的论文,这篇论文将目标检测和实例分割做成项目促进的方法来提高他们的精准度

在普通的instance segmentation的网络中,目标检测和instance segmentation是分开的,或者说,一方是依赖于另一方的,无法达到两个领域相互促进相互改进的情况

 整个网络的结构图上图所示,backbone还是FPN,然后两个head和其他instance分割的head也都差不多,对于object stream,也就是proposal的head来说,增加了一个representations,用于和pixel stream得到的结果进行交互,pixel stream得到整个图的每个像素的representation,其实都是相当于是embedding,和EmbedMask: Embedding Coupling for One-stage Instance Segmentation非常相似

From Instance-agnostic to Instance-aware
这点是讲目标检测结果促进实例分割结果,分为两个步骤

instance-agnostic to instance-aware

整个图的分割结果通过得到

其中U为pixel的representation,维度为1*d*h*w,d就是每个pixel的embedding维度

v为object的representation,维度为2*d*1*1,d就是每个object的embedding维度

通过对两个进行卷积后使用softmax,得到最后的instance分割结果

From Translation-invariant to Translation-variant.
文章中指出,由于卷积的平移不变性,两个相似的像素会产生相似的representation,因此会对最终的分割图像产生噪点,在原始two-stage instance分割网络中,因为是使用ROI pooling之后,使得分割的区域变小了,因此不会有区域外的噪点产生,但对于这种one-stage的方法是对整个图像进行分割的,就容易在ROI区域之外产生噪点。

本文通过最简单的方法,通过目标检测结果得到的RoI区域进行crop

由于上图所示,你的roi区域不一定能将整个目标完整的框进去,会产生一定的误差,因此本文就是将RoI区域进行扩大之后,再进行crop

Mask Assisted Object Detection
这点是将使用instance分割的结果来如今目标检测的结果

最简单的方法就是将instance分割结果的结果,获取它的最小边界bounding box,就是目标检测结果,但是分割结果可能会有一些噪声,因此本文将结合目标检测和分割的结果来提高检测的bounding box准确度

这个是用了一种基于概率的方法,感兴趣的可以去看论文原文

发布了164 篇原创文章 · 获赞 36 · 访问量 5万+

猜你喜欢

转载自blog.csdn.net/py184473894/article/details/103613231