Yang, C., et al., Semi-supervised low-rank representation for image classification. Signal Image & Video Processing, 2016: p. 1-8.
本文是这篇 SIViP 期刊论文的笔记,主要是对文中的理论方法进行展开详解。本人学术水平有限,文中如有错误之处,敬请指正。
摘要: LRR 可以构建低秩的、稀疏的系数矩阵,和字典矩阵的线性组合表示图像,但是实际上很不实用,因为缺少了图像信息。这是一个非监督的方法。基于 LRR ,此文提出了一种半监督的方法,标签约束稀疏低秩表示(label constrained sparse low-rank representation, LCSLRR),把标签信息加入作为硬约束条件。加入了这个约束之后,提升了低秩分解的判别能力。构建了LCSLRR 图来表示数据结构,用于半监督学习,并在图中提供边缘权值通过搜索一个低秩、稀疏的矩阵(在论文中没有看到)。
1 简介
LRR 1 通过在所有候选数据中,寻找最低秩的表达,并用已有的字典的线性组合表示数据样本。它已经能应用到人脸识别 2,显著目标检测 3,背景提取 4,追踪 5,3D 视觉恢复 6 等。LRR 是一种非监督的方法,实际使用时非常有限制。为了弥补这样的缺陷,一些额外的约束,比如非负 7 和稀疏,显示或隐式加入 LRR 中,推导出一些半监督的 LRR 算法。比如,一种非负低秩、稀疏图模型 (non-negative low-rank and sparse (NNLRS) graph 8) 是一种半监督的方法,添加约束使系数矩阵必须满足非负、稀疏和低秩,来构建一个信息图,用于半监督学习。NNLRS 的稀疏约束捕捉到数据的局部、低维的联系;而非负约束确保每一个数据都在其邻点的凸包之内(不知道有什么意义)。
此文提出了一个半监督的方法,label constrained sparse low-rank representation (LCSLRR),其加入了标签信息作为额外的约束。该方法的核心思想是有相同标签的数据有类似的表示。LCSLRR 将标签信息以一个指示矩阵的形式加入目标函数中,推导出优化过程。在推导优化方法之后,推导出图邻近结构和图权值矩阵,用于半监督学习(论文只有一段简短的文字表述,没有图???)。
此文的主要贡献有:
提出了一种半监督的学习框架,加入了标签信息到优化函数中;
提出了一种解决图特征表示的方法,基于信息图(没看到???)。该方法同时推导了图结构和图权值。其避免了微调参数的代价,可以适用于很多的实际应用场合。
2 标签约束、低秩图
LRR 是一个有效的图像表示模型。
其中
2.1 半监督有约束 LRR
加入标签信息作为约束,数据
有了这个指示矩阵
其中
其中
2.2 标签约束 LRR
观测到的数据通常是有噪声的。所以,获得低秩的数据表示可以被认为是恢复出低秩的数据矩阵
其中参数
其中
首先,加入辅助变量
然后,将约束优化问题转化为无约束的 Lagrangian 函数
其中
Algorithm 1: LCLRR
Input:
Initialize:
1: While
2: 更新
3: 更新
4: 更新
5: 更新
6: 更新
7: 检查收敛条件
8:
9: End While
Output:
2.3 标签约束稀疏 LRR
为了获得稀疏的数据表示,加入了稀疏正则项于
其中
其中
将其转化为如下的无约束 Lagrangian 函数,
将二次项
原文中的
Algorithm 2: LCSLRR
Input:
Initialize:
1: While
2: 固定
3: 固定
4: 固定
5: 更新
6: 更新
7: 检查收敛条件
8:
9: End While
Output:
2.4 标签约束低秩图构建
一般选择数据 X 自身作为字典,来学习最低秩的表达。获得了最优解
实际问题中,用数据
这里提到的构建一个图模型,此文中一个例图都没有给出?
3 实验
用了多个数据集 Yale B, PIE, USPS, ORL, AR,都统一用表格的形式给出准确率的对比。略
- Liu, G., Lin, Z., Yu, Y.: Robust subspace segmentation by low-rank representation. Mach. Learn. pp. 663–670 (2010) ↩
- Du,H., Hu,Q., Qiao,D., et al.: Robust face recognition via low-rank sparse representation-based classification. Int. J. Autom. Comput. 12(6), 579–587 (2015) ↩
- Shen, X.,Wu, Y.: A unified approach to salient object detection via low rank matrix recovery. IEEE Conference on Computer Vision and Pattern Recognition pp. 853–860 (2012) ↩
- Cui, X.,Huang, J.,Zhang, S., Metaxas, D.:Background Subtraction Using Low Rank and Group Sparsity Constraints. Springer, Berlin (2012) ↩
- Zhang, T., Ghanem, B., Ahuja, N.: Low-rank Sparse Learning for Robust Visual Tracking. Springer, Berlin (2012) ↩
- Lee, J., Shi, B. ,Matsushita,Y., Kweon, I., Ikeuchi,K.: Radiometric calibration by transform invariant low-rank structure. IEEE Conference on Computer Vision and Pattern Recognition, pp. 2337–2344 (2011) ↩
- He, R., Zheng, W.S., Hu, B.G., Kong, X.W.: Nonnegative sparse coding for discriminative semi-supervised learning. IEEE Conference on Computer Vision and Pattern Recognition, pp. 792–801 (2011) ↩
- Zhuang, L., Gao, H., Lin, Z., Ma, Y., Zhang, X., Yu, N.: Nonnegative low rank and sparse graph for semi-supervised learning. IEEE Conference on Computer Vision and Pattern Recognition pp. 2328–2335 (2012) ↩
- Candés, E.J.,Li, X.,Ma,Y.,Wright, J.: Robust principal component analysis? JACM 58(3) (2011) ↩
- Liu, G., Lin, Z., Yu, Y.: Robust subspace segmentation by low-rank representation. Mach. Learn. pp. 663–670 (2010) ↩
- Lin, Z., Liu, R., Su, Z.: Linearized alternating direction method with adaptive penalty for low rank representation. In NIPS (2011) ↩