第六周学习周报20181015-20181021

一、回顾之前看过的两篇论文

 《Fast Open-World Person Re-Identification》

（1）New search setting:LSOW
1)vast probe search population
2)fast disjoint-view search
3)sparse training person identification
4)zero-shot transfer learning

（2）New method:X-ICE
cross-view identification and verification

 《Person Re-identification with Metric Learning using Privileged Information》

创新点：
（1）local threshold，也就是priviledge信息产生的数值。
（2）可以对比多个角度的特征，一个角度学习一种度量方法。（角度：相机的视角，特征的获取方式）

二、看了一篇新的论文

《Deep Ranking for Re-identification via Joint Representation Learning》

（1）提出统一的framework，同时最大化特征和Metric的优势。
（2）采用了Alexnet的网络架构
创新点：
（1）Joint representation，将两张Images拼成一张输入
（2）测试利用probe 和gallery 间的Euclidean 和cosine，直接输出图片间的相似度
（3）最大创新：提出learning-to-rank的算法
即：如果正匹配排在了最前面则不产生loss，排的越靠后loss越大。

三、Alexnet
（1）非线性激活函数：ReLU
因为它是linear，而且 non-saturating（因为ReLU的导数始终是1），相比于 sigmoid/tanh，ReLU 只需要一个阈值就可以得到激活值，而不用去算一大堆复杂的运算
（2）防止过拟合的方法：Dropout，Data augmentation
（3）大数据训练：百万级ImageNet图像数据
a.从原始图像（256,256）中，随机的crop出一些图像（224,224）。【平移变换，crop】
b.水平翻转图像。【反射变换，flip】
c.给图像增加一些随机的光照。【光照、彩色变换，color jittering】
（4）GPU实现，LRN归一化层的使用

四、图像特征提取：HOG特征，LBP特征，Haar特征
1、HOG特征
（1）计算机视觉和图像处理中用来进行物体检测的特征描述子
（2）HOG+SVM广泛应用于图像识别中
（3）本质：梯度的统计信息，而梯度主要存在于边缘的地方
（4）对图像几何的和光学的形变都能保持很好的不变性
（5）HOG特征提取算法的实现过程：
1）灰度化
2）采用Gamma校正法对输入图像进行颜色空间的标准化（归一化）；调节图像的对比度，降低图像局部的阴影和光照变化所造成的影响，抑制噪音的干扰；
3）计算图像每个像素的梯度（包括大小和方向）；主要是为了捕获轮廓信息，同时进一步弱化光照的干扰。
4）将图像划分成小cells；
5）统计每个cell的梯度直方图（不同梯度的个数），即可形成每个cell的descriptor；
6）将每几个cell组成一个block，一个block内所有cell的特征descriptor串联起来便得到该block的HOG特征descriptor。
7）将图像image内的所有block的HOG特征descriptor串联起来就可以得到该image的HOG特征descriptor了。即最终可供分类使用的特征向量。

2、LBP特征
（1）描述图像局部纹理特征的算子
（2）具有旋转不变性和灰度不变性
（3）对LBP特征向量进行提取的步骤：
1）首先将检测窗口划分为16×16的小区域（cell）；
2）对于每个cell中的一个像素，将相邻的8个像素的灰度值与其进行比较，若周围像素值大于中心像素值，则该像素点的位置被标记为1，否则为0。这样，3*3邻域内的8个点经比较可产生8位二进制数，即得到该窗口中心像素点的LBP值；
3）然后计算每个cell的直方图，即每个数字出现的频率；然后对该直方图进行归一化处理。
4）最后将得到的每个cell的统计直方图进行连接成为一个特征向量，也就是整幅图的LBP纹理特征向量；
然后便可利用SVM或者其他机器学习算法进行分类了。

第六周学习周报20181015-20181021

猜你喜欢