rfcn校招总结

idea:ROI pooling前都是卷积,是具备平移不变性的,但一旦插入ROI pooling之后,后面的网络结构就不再具备平移不变性了,就解决了分类和定位的矛盾,但因为引入roi-wise layer,会牺牲训练和测试的效率。因此,本文想提出来的position sensitive score map这个概念是能把目标的位置信息融合进ROI pooling

rfcn是在faster上做的改进,主要改变的就是roi-pooling之后的结构,其实主要改变的是fast那一部分。faster网络经过roi-pooling后使用3个fc然后进行分类和回归,fc常常在分类网络中使用,但用在检测中会有一个问题:丧失了平移不变性。这是因为fc对输入( 
可以看另一篇博客fc全连接层的作用、卷积层的作用、pooling层、激活函数的作用)不同位置出现同一个pattern是等价的。于是采用了全卷积网络来替代fc,提出了position sensitive score map的结构,把整个框分成了k*k个位置,并用ps-poipooling替代了原始的roi-pooling。对于ps-poipooling生成的feature map,在每个channel做mean pooling以获得每个类别的概率。这一点在分类网络中也使用到了(可以看另一篇博客fc全连接层的作用、卷积层的作用、pooling层、激活函数的作用),这样做的好处一个是减少参数量,二一个是保证平移不变性。

提出position sensitive score map还有个idea:随着网络深度的增加,网络对于位置(Position)的敏感度越来越低,也就是所谓的translation-invariance,但是在Detection的时候,需要对位置信息有很强的的敏感度。

猜你喜欢

转载自www.cnblogs.com/ymjyqsx/p/9506307.html