论文笔记——Body Structure Aware Deep Crowd Counting

本文针对以往的基于density map的方法,提出其缺点是没有将人的外形信息考虑在内。因此提出了加入语义信息来提高准确度的方法。该方法主要分为三大部分:身体部分图、结构化密度图和多任务人群计数框架。

身体部分图(Body part map):该部分作用是将真值图中的每个人标注出来。作者假设一个实际空间中长2米、宽1米的框能将人彻底包括。因此每个人都可以用长方形框对角线的两个像素点表示,计算方法为:


在这里插入图片描述

Px和Py表示头部标注点的位置。M(Ph)表示头部标注位置的透视图。
然后将所得图像输入到语义分析模型中,将头部、身体和腿部分离出,最终结果如下图所示:


结构化密度图(Structured Density Map):即在传统生成的密度图上body part map得出的结果,使密度图也具有人体结构化的特征。如下图所示:


在这里插入图片描述

人群计数框架:


在这里插入图片描述

框架为局部图像输入,作者建立了两个分支,用网络来学习body map和structured density map,以此来使该方法具有普适性。

创新点:
1.加入了语义模型。虽然感觉上该模型会受到人群遮挡的强烈影响,但是实验证明效果也挺好。
2.利用Data-dependent,使网络具有普适性。

猜你喜欢

转载自blog.csdn.net/m0_37973735/article/details/88174494
今日推荐