人脸识别之线性回归

首先特别感谢《Linear Regression for Face Recognition》的作者Imran Naseem,Roberto Togneri对该paper的写著，这里写了一些个人理解的心得，如有不足之处，望海涵，可以私信我，加以更正。

主要内容：用线性回归的方法去人脸识别。LRC算法用最近邻子空间分类法进行分类，解决障碍物问题，提出了一个Modular LRC方法，介绍Distance-based Evidence Fusion（DEF）算法。主要就是解决围巾遮挡问题。

introduction：

高维特征映射到低维特征，主要目的就是找到一个基础的函数去变换，有区分的表示人脸。一般的方法：PCA、LDA、ICA等都是分两类：重构和区分。事实上，特征空间的选择不那么重要，重要的是特征空间的维数和分类器的设计。

定义人脸识别为一个线性回归问题，最小二乘估计参数向量。决策规则：最精确的留下。分类器：Nearest Subspace （NS）方法。下采样，训练得到一个字典矩阵，ill-conditioned problem用稀疏的L1范数最小化去解决。Locally Linear Regression（LLR）解决pose问题，nonfrontal face 和frontal counterpart。线性回归能去预测nonfrontal 相对应的虚拟出来的frontal patch。用小波分解和discriminant analysis（判别式分析）去设计一个复杂的特征提取。discriminant features 用于develop 特征平面（Nearest Feature Plane分类器）和特征空间（nearest Feature Space分类器）。LRC用下采样图像联合线性回归分类去实现先前的结果。用Modular LRC去解决遮挡问题。DEF算法做最终决策，决定哪部分是好的。

2 LINEAR REGRESSION FOR FACE RECOGNITON

LRC算法：

训练图片N个，a*b这么大，之后下采样为c*d，变成列向量q（矩阵的拉直），归一化处理这些向量，Xi是这q维向量的堆积。一个训练样本下采样拉直是X的一个列。Xi可称为第i类的regressor or predictor，z是无标签的特侧图像，给z分类，y是归一化、灰度处理后的向量，如果y是第i类，则能用Xi线性表示。

LRC的modular方法（分块）：

用分块表示法能高效解决识别中的遮挡问题，在modular approach中，我们用连续像素的近邻特性把人脸分为一些子图像。最后决断依赖于所有这些子图像决断信息的融合。投票的缺点是：把噪声和干净的图像同等对待（我觉得应该分开，有用的子图像可以整点权重啥的）。没有障碍分布的先验使得处理这个问题很复杂。本文的做法：用distance classification 去develop a fairly simple ，是一个高效的fusion strategy，遮挡的不那么重要了，提高了分类的精确性。被遮挡的图像分为M块，每一块为vn，n=1，，，M，从第i类中训练图像，下采样、变换为向量，之后同LRC。多了一个决策过程。每一个小块，从第n类里面选个误差最小的，再从这所有块中，选出一个最小的，作为最终决策。

3、 EXPERIMENTAL RESULTS

用5个标准数据库来说明这个算法的高效性。这些数据库混合了一个姿势、光照、障碍、姿态变化等。这个方法对一些姿势变化和连续遮挡能有较好的性能，但是，不意味着对光照和姿势的变化就鲁棒。

3.1AT&T Database

简单介绍：包括40个人，一个人十张图片；混合脸部姿态：笑或者不笑、睁眼睛或者闭眼睛、戴眼镜或者不戴眼镜，同样可以容忍脸部最大20°的偏转。

EP1：前五个作为训练样本、后五个作为测试样本；

EP2：leave one out

下采样一样，都是50D的特征空间，（其实LRC并不是效果那么好，里面明显有比它效果好的，，，，这岂不是不鞥显示LRC的优势，不具有说服力。）

3.2 Georgia Tech (GT) Database

简单介绍：包括50个人，一个人15张图片；可以有pose expression 、clutterd background、illumination的变化。下采样为15*15到225D的特征空间中，八张用来训练，剩下的用来测试（probes），所有实验都在原图上进行，不经过任何处理（cropping、normalization）结果：这次较好，还是没有ERE_S好。

3.3 FERET Database

EP1：简介：最大的公开的数据库，我们选了一个子数据库，包括128个人，每个人至少4个图片。LRC方法用每个人的gallery image去构建一个线性子空间，不需要其他的face space的拓展，但是，LRC要求有多样的gallery image 去构建一个可信的线性子空间。用单人的单个gallery image 不是线性回归的本质，它只是一个简单的regressor或者predictor，导致错误的最小二乘计算。

这次实验，用42D的特征空间，一个图片用来实验，三个图片用来训练，两张是正脸的，很少其他的变化，后两张变化比较多，LRC能很好的处理在pose变化时候面部表情的变化。

EP2：找400个随机选的人。

3.4 Extended Yale B Database

简介：由38个人的2414个图片，光照不同，这个数据库分为五个子数据库，1、每人7个图片，共266张，正常光照条件，用来做gallery，其他的用来做测试（validation）；2/3、一个人12张，光照从 slight—moderate变化；4、一个人14张，5、一个人19张，4和5都有severe light variations。

所有图像下采样为20*20，LRC对moderate light variation效果最好100%识别，但对2和3效果不太好（说明对光变化敏感，不具有鲁棒性），对一般性光照变化表现的性能还是可以的，不能够忍受severe luminance alterations。

3.5 AR Database

简介：包含4000多个彩色图片，126个人，70男，56女，不是理想的场景，混合多变的面部表情，光照变化，遮挡（眼睛和围脖）。两个挑战：人脸表情变化和连续的遮挡。

gesture variation

脑袋方向的变化是一个极大的挑战，一些人脸识别和方向正则化算法（这是什么？调整一下脑袋的方向？使其与正常的人的方向一致？之后便于识别？）用在这些面部特征上（眼睛鼻子嘴巴）。但是不好用（因为有的眼睛闭着甚至都不能识别），这里，对于每一个给定的人脸识别算法，有两个可能的方法去评估真是的鲁棒性： by implementing an automatic face localization and normalization module before the actual face recognition module or

2) by evaluating the algorithm using the original frame of the face image rather than a manually localized and aligned face. 1、在当前的人脸识别块之前，用一个自动人脸区域，标准化；2、用原始的人脸图像框架去评估算法，而不是用局部的、均衡的人脸。

用AR数据库中125个人，选出100个个体一半男的一般女的，下采样到10*10，用三个不同表情的去训练，一个留作测试，识别的还可以。

contiguous occlusion

连续遮挡是人脸识别的大问题，在遮挡的现状来看，automatic face localization and 弄normalization问题得到了放大（magnified）。在一些裁剪不正的、均衡的图片上实验experiments on manually cropped and aligned databases make an implicit assumption of an evenly cropped and nicely aligned face, which is not available in practice。

LRC对戴眼镜的识别效果很好，SRC都不行，但是围脖，LRC不行，SRC很好。开始讲述modular LRC的高效性。从数据库里面在尺度和方向上有变化的，产生一些裁剪不正和均衡的一些列图片构成100个人，先用眼睛和嘴巴的位置对图像均衡化（aligned），每个图像裁剪为292*240。

所有图像分成四块，标号，LRC方法测试产生较大误差，modular LRC中，有围脖的直接被拒绝，不参与性能评估，不参与最终决策，这个算法的两个优点：一自动忽略没脸的部分；二、有效的、动态的融合利用了充足的脸部子图像的信息去产生一个全局的识别。

4、conclusion

主要讲一个新的分类算法，把人脸识别当做一个线性回归问题。LRC算法处理了面部表情变化和连续遮挡的问题，通过大量实验说明这个事，LRC对没有处理的人脸有较精确的识别能力，在不理想的情况下（有遮挡、光照或者gestures，一些cropped and aligned脸）不可用（对我们的算法影响大不大）。所以，LRC算法对真实的场景，识别性能能得到认可，对有遮挡的人脸识别问题，modular LRC算法用一个高效的有理有据的熔断策略产生了较好的效果。

在人脸识别的例子中，特征选择是一个有争议的话题，类似于下采样或者random projections的非正统特征选择，在传统的意识形态里有分歧，LRC事实上证实了这一新兴的belief，它对分类器选择的挺合适，下采样比传统的方法还产生较好的效果。这回提出的算法的简单框架，在计算上是高效的，因而对人脸识别来说，这是一个不错的候选，其他特征方向包括对光照、随机像素遮挡、姿势变化相关的鲁棒问题。

转载请声明出处，谢谢。

人脸识别之线性回归

猜你喜欢