【知识笔记】关于计算机视觉三大顶会和行人重识别的一些基础知识梗概

知识梗概

行人重识别

行人重识别是指在已有的可能来源与非重叠摄像机视域的视频序列中识别出目标行人。
是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。
广泛被认为是一个图像检索的子问题。
研究该问题对公共安全和刑侦有着非常重要的现实意义。
挑战点、难点：不同摄像设备之间的差异，行人兼具刚性和柔性的特性，外观易受穿着、尺度、遮挡、姿态和视角的影响等。
研究面临着诸如图像分辨率低、视角变化、姿态变化、光线变化以及遮挡等带来的诸多挑战。
基于图像的行人重识别和基于视频的行人重识别。
行人重识别算法大致可分为基于特征描述的方法和基于距离度量学习的方法两类。
基于特征描述的方法关注的是找到较好的描述行人外貌特征的表观模型，基于度量学习的方法关注的是找到有效的行人特征相似度的度量准则。

Gabor 特征

Gabor 特征是一种可以用来描述图像纹理信息的特征。
Gabor 特征主要依靠 Gabor 核在频率域上对信号进行加窗，从而能描述信号的局部频率信息。

方向梯度直方图

方向梯度直方图（Histogram of Oriented Gradient, HOG）特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。HOG特征通过计算和统计图像局部区域的梯度方向直方图来构成特征。

支持向量机

支持向量机（Support Vector Machine, SVM）是一类按监督学习（supervised learning）方式对数据进行二元分类的广义线性分类器（generalized linear classifier），其决策边界是对学习样本求解的最大边距超平面（maximum-margin hyperplane）
SVM使用铰链损失函数（hinge loss）计算经验风险（empirical risk）并在求解系统中加入了正则化项以优化结构风险（structural risk），是一个具有稀疏性和稳健性的分类器 [2] 。SVM可以通过核方法（kernel method）进行非线性分类。

核方法

核方法kernel methods (KMs)是一类模式识别的算法。其目的是找出并学习一组数据中的相互的关系。用途较广的核方法有支持向量机、高斯过程等。
核方法是解决非线性模式分析问题的一种有效途径，其核心思想是：首先，通过某种非线性映射将原始数据嵌入到合适的高维特征空间；然后，利用通用的线性学习器在这个新的空间中分析和处理模式。

奇异值分解

奇异值分解（Singular Value Decomposition）是线性代数中一种重要的矩阵分解，奇异值分解则是特征分解在任意矩阵上的推广。在信号处理、统计学等领域有重要应用。

生成式对抗网络

生成式对抗网络（GAN, Generative Adversarial Networks ）是一种深度学习模型，是近年来复杂分布上无监督学习最具前景的方法之一。

论文下载流程

访问https://arxiv.org/
检索相关论文
点击PDF版本
加载出页面后选择预览
在弹出PDF窗口工具栏选择分享
选择发送到QQ
从QQ中拷取