行人检测最有价值的三篇文章

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/yunxinan/article/details/85242643

1、解决行人检测中密集遮挡问题
论文题目:Repulsion Loss: Detecting Pedestrians in a Crowd
论文链接:https://arxiv.org/abs/1711.07752
损失函数共包含三部分,第一部分为预测框与真实目标框所产生的损失值(attraction term);第二部分为预测框与相邻真实目标框所产生的损失值(repulsion term(RepGT));第三部分为预测框与相邻不是预测同一真实目标的预测框所产生的损失值(repulsion Box(RepBox))。通过两个相关系数alpha和beta来平衡两部分repulsion损失值。论文中试验结果显示两个相关系数都设置为0.5取得了较好的效果。
2、Bi-box
论文题目:Bi-box Regression for Pedestrian Detection and Occlusion Estimation
论文链接:https://cse.buffalo.edu/~jsyuan/papers/2018/Bi-box Regression for Pedestrian Detection.pdf
(1)遮挡问题一直是行人检测领域非常具有挑战性的一个问题。其困难在于:从当前常见的行人检测benchmark的评估的角度,需要检测器输出被遮挡目标的整体部分,为此检测器需要根据仅有的未被遮挡的信息来推断出整个目标的位置,如何利用未被遮挡的信息是解决这一问题的关键,本文则将这一信息直接用于指导网络训练,也即指导网络在输出行人目标整体box的同时也要输出行人目标的可见部分box,实验证明这种思路是有效的,能够显著提升行人检测的准确性,笔者认为该思路有效的原因在于训练过程中给了网络更多的supervision,但这种方法所产生的代价也是显而易见的,也就是其需要数据集额外给出行人目标可见部分的标注,故该方法无法在没有可见部分标注的数据集上使用。
(2)不可否认的是,未来将还会有大量的工作聚焦于行人检测中的遮挡问题。从本文可以得到的一个启发是:只要给予网络训练以正向的指导(例如明确告知其遮挡的程度)就能获得一定的性能提升,因此可以从数据增广的角度考虑增加训练集中行人遮挡类型的丰富程度,也是值得探索的一个方向。
3、OR-CNN
论文题目:Occlusion-aware R-CNN: Detecting Pedestrians in a Crowd
论文链接:https://arxiv.org/abs/1807.08407
OR-CNN遵循两阶段的Faster R-CNN的检测框架,其主要包括两个部分:第一阶段RPN产生目标候选框,第二阶段Fast R-CNN对目标候选框进行进一步的分类和回归。为了处理遮挡问题,本文提出两种策略:aggregation loss和PORoI pooling unit,分别加持在两个阶段上,当然aggregation loss也适用于第二阶段

常见二阶段RPN算法的作用原理
RPN生成了region proposals、scores和features,这些都被用于训练Boosted Forest分类器

猜你喜欢

转载自blog.csdn.net/yunxinan/article/details/85242643