pose machine论文基本思想和全文翻译

pose machine论文基本思想和全文翻译


基本思想

pose machine的整体流程图
网络分为多个层级多个stage,每个层级的输入是一个patch(图像的部分),即从图像中以点z(x,y)为中心得到的一个矩形框(可以设定不同的大小)。第一个stage的层级1将从patch得到的特征 1 x z 作为输入,经过多分类器 1 g 1 得到各个part的置信 1 b 1 ,接下来的stage同时将特征 1 x z 和上一个stage在不同层级上得到的上下文信息 Ψ 作为输入,经过分类器 1 g 2 得到这个阶段各个part的置信,此时得到的结果比stage1的结果好。

这里的上下文信息 Ψ 分为两部分,一部分是上下文patch特征,一部分是上下文offset特征。前一部分是每个层级上所有part在位置z处score的级联,是对短距离的关系进行处理;后一部分先获取所有part在l层级t-1 stage上的置信的峰值,然后计算part p从z到峰值k的极坐标偏移向量,也对长距离的交互进行编码。

论文翻译链接


猜你喜欢

转载自blog.csdn.net/qq_26793775/article/details/81463264