点击上方“机器学习与生成对抗网络”,关注"星标"
获取有趣、好玩的前沿干货!
注:帮一位朋友介绍工作,欢迎大家star。
Attention-guided Context Feature Pyramid Network for Object Detection
https://arxiv.org/pdf/2005.11475.pdf
https://github.com/Caojunxu/AC-FPN
在目标检测领域,图像输入越来越大(1333 * 800),但使用的特征提取网络还是图片分类时候的(224*224).
显然地,感受野已经“不太够用”了:因为看得见,所以会相信;如果看不见,那就乱来了。
为解决此问题,AC-FPN设计了一个新的网络结构,称为以注意力导向的上下文特征金字塔网络,该网络结构通过融合多路不同感受野特征,不仅增大物体感受野,而且还可以利用物体的上下文信息,更好得给出分类结果。
该模型主要包含两个模块:第一个是上下文提取模块(CEM),它从多个感受野中探索大量上下文信息,但冗余的上下文关系可能会误导定位以及识别,因此还设计了第二个模块,称为注意力引导模块(AM),该模块可以通过注意力机制来自适应提取显著对象周围的有用信息。AM由两个子模块组成,即上下文注意模块(CxAM)和内容注意模块(CnAM),它们分别用于捕获区分性语义信息和定位精确位置信息,从而得到更好的检测和分割结果。
AC-FPN可以轻松插入现有的基于FPN的模型中,在使用不到200行代码就可以提升FPN-resnet50近3mAP,在其他前沿框架也取得了很大的提升。
代码已经开源:https://github.com/Caojunxu/AC-FPN
公众号近期荐读:
【无中生有的AI】关于deepfake的种类、危害、基础实现技术和挑战
更多分享、长按关注本公众号: