「Computer Vision」Note on CenterNet

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/dgyuanshaofeng/article/details/89388508

QQ Group: 428014259
Tencent E-mail:[email protected]
http://blog.csdn.net/dgyuanshaofeng/article/details/89388508

作者:Kaiwen Duan, Song Bai, Lingxi Xie, Honggang Qi, Qingming Huang, Qi Tian
单位:University of Chinese Academy of Sciences; University of Oxford (牛津大学); Huawei Noah’s Ark Lab

0 摘要

CenterNet是CornerNet的改进版。CenterNet以triplet of keypoints表示一个物体,而CornerNet以pair of keypoints表示一个物体。作者们这么做,使得precision精准度和recall召回率都可以提升。设计cascade corner pooling和center pooling。在MS COCO数据集上,mAP达到47%。【地表最强单阶段物体检测器,原来是多尺度测试的。单尺度测试的话为44.9%】

1 介绍

指出anchor-based的缺点:大量预定义的anchors;anchors和金标准boxes没有aligned对齐。keypoint-based也算是anchor-free了。指出CornetNet的缺点:缺乏global information,因为点对实际上就是关注局部信息【这里局部信息有问题,因为角点池化或者角点为物体外面,仅能捕获边界信息】了。上述缺点造成很多不准确的边界框,如图1所示。CenterNet多预测一个中心点。

2 相关工作

3 作者的方法

3.1 baseline和motivation

CornetNet为baseline。

3.2 关键点三元组

结构如图2所示。怎么表示一个物体?答案是利用center keypoint和a pair of corners。实际上,在医学图像分析中,早就有人这么做了,利用中心点得到心脏的位置,只是边界框是人为给出的,参考文献[2]。到目前为止,该方法仍然是心脏多子结构分割的最好方法。CenterNet在CornetNet的基础上增加了中心关键点的热图和偏移预测。怎么滤掉不准确的边界框?答案是:1、根据scores,选择top-k中心点;2、remap中心关键点;3、定义边界框中心区域并check中心区域是否包含了中心关键点。边界框类别要与中心关键点类别一样;4、如果为真,保留边界框。边界框的score被三点的平均score替代。如果为假,去掉边界框。

图 2:CenterNet的结构

作者们认为中心区域的大小影响检测结果。设计了scale-aware的中心区域,如图3所示。

3.3 丰富中心和角点信息

中心池化:如图4(a)所示。类似角点池化了。
级联角点池化:如图4(a)所示。两次角点池化了。
以上两个模块见图5。

3.4 训练和推理

训练:基本和CornetNet一样。
推理:基本和CornetNet一样。
这么来说,训练时间估计也是一周了。

4 实验

4.1 数据集,评价标准和基线

4.2 与世界一流检测器比较

如表2所示。

4.3 不准确BBox减少

如表3所示。

4.4 推理速度

Tesla P100,Hourglass-104,300ms;Hourglass-52,270ms。不算快。

4.5 消融实验

4.6 误差分析

和CornerNet的实验一样。。。

5 结论

[1] CenterNet: Object Detection with Keypoint Triplets 2019 [paper] [PyTorch code]
[2] Multi-label Whole Heart Segmentation Using CNNs and Anatomical Label Configurations STACOM 2017 [paper]

猜你喜欢

转载自blog.csdn.net/dgyuanshaofeng/article/details/89388508