第六周学习周报20181015-20181021

一、回顾之前看过的两篇论文

 《Fast Open-World Person Re-Identification》

(1)New search setting:LSOW
1)vast probe search population
2)fast disjoint-view search
3)sparse training person identification
4)zero-shot transfer learning

(2)New method:X-ICE
cross-view identification and verification

 《Person Re-identification with Metric Learning using Privileged Information》

创新点:
(1)local threshold,也就是priviledge信息产生的数值。
(2)可以对比多个角度的特征,一个角度学习一种度量方法。(角度:相机的视角,特征的获取方式)

二、看了一篇新的论文

《Deep Ranking for Re-identification via Joint Representation Learning》

(1)提出统一的framework,同时最大化特征和Metric的优势。
(2)采用了Alexnet的网络架构
创新点:
(1)Joint representation,将两张Images拼成一张输入
(2)测试利用probe 和gallery 间的Euclidean 和cosine,直接输出图片间的相似度
(3)最大创新:提出learning-to-rank的算法
即: 如果正匹配排在了最前面则不产生loss,排的越靠后loss越大。

三、Alexnet
(1)非线性激活函数:ReLU
因为它是linear,而且 non-saturating(因为ReLU的导数始终是1),相比于 sigmoid/tanh,ReLU 只需要一个阈值就可以得到激活值,而不用去算一大堆复杂的运算
(2)防止过拟合的方法:Dropout,Data augmentation
(3)大数据训练:百万级ImageNet图像数据
a.从原始图像(256,256)中,随机的crop出一些图像(224,224)。【平移变换,crop】
b.水平翻转图像。【反射变换,flip】
c.给图像增加一些随机的光照。【光照、彩色变换,color jittering】
(4)GPU实现,LRN归一化层的使用

四、图像特征提取:HOG特征,LBP特征,Haar特征
1、HOG特征
(1)计算机视觉和图像处理中用来进行物体检测的特征描述子
(2)HOG+SVM广泛应用于图像识别中
(3)本质:梯度的统计信息,而梯度主要存在于边缘的地方
(4)对图像几何的和光学的形变都能保持很好的不变性
(5)HOG特征提取算法的实现过程:
1)灰度化
2)采用Gamma校正法对输入图像进行颜色空间的标准化(归一化);调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,抑制噪音的干扰;
3)计算图像每个像素的梯度(包括大小和方向);主要是为了捕获轮廓信息,同时进一步弱化光照的干扰。
4)将图像划分成小cells;
5)统计每个cell的梯度直方图(不同梯度的个数),即可形成每个cell的descriptor;
6)将每几个cell组成一个block,一个block内所有cell的特征descriptor串联起来便得到该block的HOG特征descriptor。
7)将图像image内的所有block的HOG特征descriptor串联起来就可以得到该image的HOG特征descriptor了。即最终可供分类使用的特征向量。

2、LBP特征
(1)描述图像局部纹理特征的算子
(2)具有旋转不变性和灰度不变性
(3)对LBP特征向量进行提取的步骤:
1)首先将检测窗口划分为16×16的小区域(cell);
2)对于每个cell中的一个像素,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3*3邻域内的8个点经比较可产生8位二进制数,即得到该窗口中心像素点的LBP值;
3)然后计算每个cell的直方图,即每个数字出现的频率;然后对该直方图进行归一化处理。
4)最后将得到的每个cell的统计直方图进行连接成为一个特征向量,也就是整幅图的LBP纹理特征向量;
然后便可利用SVM或者其他机器学习算法进行分类了。

猜你喜欢

转载自blog.csdn.net/qq_24924689/article/details/83268289