「Computer Vision」Note on CenterNet

QQ Group: 428014259
Tencent E-mail：[email protected]
http://blog.csdn.net/dgyuanshaofeng/article/details/89388508

作者：Kaiwen Duan, Song Bai, Lingxi Xie, Honggang Qi, Qingming Huang, Qi Tian
单位：University of Chinese Academy of Sciences; University of Oxford (牛津大学); Huawei Noah’s Ark Lab

0 摘要

CenterNet是CornerNet的改进版。CenterNet以triplet of keypoints表示一个物体，而CornerNet以pair of keypoints表示一个物体。作者们这么做，使得precision精准度和recall召回率都可以提升。设计cascade corner pooling和center pooling。在MS COCO数据集上，mAP达到47%。【地表最强单阶段物体检测器，原来是多尺度测试的。单尺度测试的话为44.9%】

1 介绍

指出anchor-based的缺点：大量预定义的anchors；anchors和金标准boxes没有aligned对齐。keypoint-based也算是anchor-free了。指出CornetNet的缺点：缺乏global information，因为点对实际上就是关注局部信息【这里局部信息有问题，因为角点池化或者角点为物体外面，仅能捕获边界信息】了。上述缺点造成很多不准确的边界框，如图1所示。CenterNet多预测一个中心点。

2 相关工作

3 作者的方法

3.1 baseline和motivation

CornetNet为baseline。

3.2 关键点三元组

结构如图2所示。怎么表示一个物体？答案是利用center keypoint和a pair of corners。实际上，在医学图像分析中，早就有人这么做了，利用中心点得到心脏的位置，只是边界框是人为给出的，参考文献[2]。到目前为止，该方法仍然是心脏多子结构分割的最好方法。CenterNet在CornetNet的基础上增加了中心关键点的热图和偏移预测。怎么滤掉不准确的边界框？答案是：1、根据scores，选择top-k中心点；2、remap中心关键点；3、定义边界框中心区域并check中心区域是否包含了中心关键点。边界框类别要与中心关键点类别一样；4、如果为真，保留边界框。边界框的score被三点的平均score替代。如果为假，去掉边界框。

图 2：CenterNet的结构

作者们认为中心区域的大小影响检测结果。设计了scale-aware的中心区域，如图3所示。

3.3 丰富中心和角点信息

中心池化：如图4(a)所示。类似角点池化了。
级联角点池化：如图4(a)所示。两次角点池化了。
以上两个模块见图5。

3.4 训练和推理

训练：基本和CornetNet一样。
推理：基本和CornetNet一样。
这么来说，训练时间估计也是一周了。

4 实验

4.1 数据集，评价标准和基线

4.2 与世界一流检测器比较

如表2所示。

4.3 不准确BBox减少

如表3所示。

4.4 推理速度

Tesla P100，Hourglass-104，300ms；Hourglass-52，270ms。不算快。

4.5 消融实验

4.6 误差分析

和CornerNet的实验一样。。。

5 结论

[1] CenterNet: Object Detection with Keypoint Triplets 2019 [paper] [PyTorch code]
[2] Multi-label Whole Heart Segmentation Using CNNs and Anatomical Label Configurations STACOM 2017 [paper]