『算法学习』CPN:Cascaded Pyramid Network for Multi-Person Pose Estimation

原文L:https://www.cnblogs.com/hellcat/p/10138036.html

论文连接

CVPR2018的文章,用于关键点检测(原话叫“多人姿态估计”)。本算发聚焦点在于处理多人姿态估计所面临的挑战:关键点遮挡,关键点不可见,复杂背景等——就是优化对于难以检测的点的预测,即着重于处理 “hard” 关键点。

思路就是detector先定位bbox,然后使用CPN检测关键点,其中原作者使用的是FPN进行bbox定位(下图解释了FPN的优越性),并应用了ROIAlign。

CPN本体由两部分组成:GlobalNet和RefineNet,流程如下图所示,GlobalNet对关键点进行粗提取,RefineNet精细加工难以识别的网络(RefineNet对不同层信息进行了融合,可以更好的综合特征定位关键点)。

GlobalNet 采用类似于FPN的特征金字塔结构,并在每个elem-sum前添加了1x 卷积。

RefineNet基于GlobalNet生成的特征金字塔,其链接了所有层的金字塔特征用于定位“hard”关键点。

猜你喜欢

转载自blog.csdn.net/m0_37644085/article/details/85098929