《Revisiting Perspective Information for Efficient Crowd Counting》密集人群检测论文笔记

其他 2020-03-03 13:50:48 阅读次数: 0

背景

密集人群检测常常遇到的一个问题：近处的物体在图片上比较大，远处的在图片上比较小，如下所示，图片越往上，人所占据的像素越少,也就是透视失真

本文思路

如果能够提前知道透视信息，对网络而言显然会有提升。根据下图的透视模型

行人在相机上的成像公式如下

则透视关系为

H人高固定为1.75m，所以透视值只和图片中人的高度h有关，这样就可以得到一个透视图

这么做在UCSD和WorldEpo'10数据集OK，但是在密集人群中，因为遮挡，很难测得图片中的人高。一个自然的改进方法就是利用人头的大小反应透视变换，其中人头大小可以通过K近邻确定。得到人头大小后，基于传统的线性变换就可以得到透视信息，不过传统方法基于一系列的假设，如地面是平的，相机没有旋转（正对），采样得到的人头像素值足够精确，并且k近邻确定人头大小的方法取决于人群密度，这些都会导致得到的透视信息不够精确。为此作者提出了一个非线性的方法，如下

\(y_h\)是行数， \(a,b,c\)在在不同的图片中有不同的值（论文里面没说怎么确定这三个参数-。-）。

网络结构

网络结构如上图，个人理解也就是一个attention模块，利用perspective map做attention。

猜你喜欢

转载自www.cnblogs.com/rookiechenv587/p/12374798.html

《Revisiting Perspective Information for Efficient Crowd Counting》密集人群检测论文笔记

《Adaptive Density Map Generation for Crowd Counting》密集人群检测论文笔记

【论文笔记】SafeHidden: An Efficient and Secure Information

深度学习论文: RepViT: Revisiting Mobile CNN From ViT Perspective及其PyTorch实现

【论文笔记】Encoding Social Information with Graph Convolutional Networks for Political Perspective Detection in News Media

Crowd Counting（人群计数）

crowd counting

论文笔记《Crowd Counting with Deep Negative Correlation Learning》

论文笔记——Body Structure Aware Deep Crowd Counting

《Learning from Synthetic Data for Crowd Counting in the Wild》论文笔记

《Learning from Synthetic Data for Crowd Counting in the Wild》论文笔记

ICLR2022《REVISITING OVER-SMOOTHING IN BERT FROM THE PERSPECTIVE OF GRAPH》

Entropy Search for Information-Efficient Global Optimization

《Improved Crowd Counting Method Based on Scale-Adaptive Convolutional Neural Network》论文笔记

《Improved Crowd Counting Method Based on Scale-Adaptive Convolutional Neural Network》论文笔记

《LOCALITY-CONSTRAINED SPATIAL TRANSFORMER NETWORKFOR VIDEO CROWD COUNTING》论文笔记

《Multi-scale Convolutional Neural Networks for Crowd Counting》论文笔记

《Multi-scale Convolutional Neural Networks for Crowd Counting》论文笔记

《Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network》论文笔记

《LOCALITY-CONSTRAINED SPATIAL TRANSFORMER NETWORKFOR VIDEO CROWD COUNTING》论文笔记

论文速读 -- Efficient Spatial-Temporal Information Fusion for LiDAR-Based 3D Moving Object Segmentation

Distribution Matching for Crowd Counting阅读笔记

Crowd Counting 人群计数 [MCNN] 复现过程记录

《Pruning Filters for Efficient Convnets》论文笔记

阅读文献(一):Joint Sensing and Communication-Rate Control for Energy Efficient Mobile Crowd Sensing

Multi-Perspective Context Matching for Machine Comprehension论文笔记

人群密度估计-Crowd Density

【论文笔记】：Revisiting Graph Neural Networks: All We Have is Low-Pass Filters

Revisiting Oxford and Paris: Large-Scale Image Retrieval Benchmarking论文笔记

【论文笔记】MacBert：Revisiting Pre-trained Models for Chinese Natural Language Processing

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)