基于卷积的密度统计（一）密度图的生成

在基于卷积的人数统计中，一种是最后回归整张图的人数，即输入图像，输出人群个数，另外一种是回归人群分布密度图，即输入图像，得到的是密度分布。显然得到密度分布的人数统计方法不仅能得到人数的精确统计而且等得到人群分布的空间位置，所以，越来越多的研究偏重于得到密度图和人数统计。

先来一篇综述了解单幅图像人数统计和密度生成的方法汇总Sindagi V A, Patel V M. A survey of recent advances in CNN-based single image crowd counting and density estimation[J]. Pattern Recognition Letters, 2017.

Single-Image Crowd Counting via Multi-Column Convolutional Neural Network中生成密度图时采用脉冲函数卷积高斯核的方式来定义密度图。假设标注点的位置为xi，那么具有N个头的标签可以被表示为
这里写图片描述
这里把它与高斯函数做卷积变成一个连续的函数。但是这种密度函数假设每个xi在图像空间中是独立的。然而事实上，每个xi是在3D场景中一个人群密度的样本，并且由于透视失真，不同样本xi相关的像素与场景中区域的不同尺度一致。于是为了精确估计群体密度，需要考虑透视变换。如果假设在一个人头区域的周围，人群的密度是均匀的，它的最近邻给出了一个对于几何形变的合理的估计。
对于每一个人头的xi点，给出了k个近邻距离的的平均值di，于是，与xi相关的像素对应于场景中地面上的一个区域，这个区域的半径与di成正比。于是，为了估计像素xi周围的人群密度，为我们需要把H（x）卷积一个自适应的高斯核的，这个高斯核的的方差σi是可变的并且和di成比例。这个密度函数被表示为
这里写图片描述
这里，作者给出了β=0.3作为传播参数。

其实，上面说了那么多，总结就是把标签H和一个自适应核的高斯核函数进行卷积，这个高斯核函数的方差为β与xi的K个最近邻平均距离的乘积。在程序中的体现就是从ground truth中提取xi点，做高斯卷积，高斯卷积的sigma是K=2时近邻的平均距离。

这样，得到了原始图像的人群密度图像作为卷积神经网络的输出来训练网络。

基于卷积的密度统计（一）密度图的生成

猜你喜欢