Feng, J., Xu, H., & Yan, S. (2013). Online robust pca via stochastic optimization. In Advances in Neural Information Processing Systems (pp. 404-412).
本文是这篇 NIPS 会议论文的笔记,主要是对文中的理论方法进行展开详解。本人学术水平有限,文中如有错误之处,敬请指正。
摘要:RPCA 是一种典型的基于批量数据的优化方法,并需要在优化过程中,将所有样本载入内存中。这阻碍了它用于高效地处理大数据。此文设计了一种 Online RPCA 的算法,可以一次处理一张图像,使其内存消耗与样本的数量无关,极大地提升了计算和存储的效率。提出的方法是基于随机优化的,等价于批量形式的 RPCA 。确实,ORPCA 提供了一系列的子空间估计,收敛至其批量形式的最优点,所以被证明是对于稀疏的损坏是鲁棒的。另外,ORPCA 是很自然地用于动态子空间跟踪。基于子空间恢复和跟踪的仿真展示了其鲁棒性和效率上的优势。
1 简介
略
2 相关工作
略
3 构建问题
3.1 符号
向量用粗体小写字母表示,
3.2 目标函数构建
Robust PCA (RPCA) 可以准确地估计观测样本的潜在子空间,即使样本被严重的、不稀疏的噪声破坏。非常流行的 RPCA 方法之一,Principal Component Pursuit (PCP) 方法 1 提出用于解决:将样本矩阵
要求解该问题,迭代优化的方法比如 Accelerated Proximal Gradient (APG) 2 或 Augmented Lagrangian Multiplier (ALM) 3 通常被采用。然而,这些方法都是以批量的形式实现的。在优化的每一次迭代中,它们需要通过所有的样本进行 SVD 操作。所以,大量的存储的代价就出现,当其用于处理大数据时,比如网络数据,大规模图像集。
此文考虑的是 online 的 PCP 方法的实现。主要的困难是核范数紧密地结合了所有的样本,使得样本不能被分离地考虑,像典型的在线优化问题。为了克服这个,此文使用一个核范数的等价形式:一个矩阵
也就是说,核范数可以明确地用低秩分解的形式表示。其最初于 5 中提出,并在 6 7 中很好地应用。在公式中,
将
尽管此目标函数并不是关于
给定一个有限的样本集
其中,每一个样本的损失函数定义如下
该损失函数测量一个样本
其中期望是通过样本
4 Online RPCA 随机优化
该算法的主要思想是设计一个随机优化的算法,最小化代价函数,每一个时间点处理一个样本。系数
这是经验的代价函数
算法被总结于 Algorithm 1 中。其中第一个子问题涉及一个小规模的凸问题,可以被有效地求解。具体推导见 Appendix 。为了更新基
接下来的部分为理论推导省略,详见原文。
Algorithm 1 Online RPCA 随机优化
输入:
for
end for
Return
Algorithm 2 基更新步骤
输入:
for
end for
Return
5 实验
略
Appendix
Algorithm 1: 2) 过程推导。
其中
Algorithm 2: 过程推导。
采用块坐标下降,其更新
- E.J. Candes, X. Li, Y. Ma, and J. Wright. Robust principal component analysis? ArXiv:0912.3599, 2009. ↩
- Z. Lin, A. Ganesh, J. Wright, L.Wu, M. Chen, and Y. Ma. Fast convex optimization algorithms for exact recovery of a corrupted low-rank matrix. Computational Advances in Multi-Sensor Adaptive Processing (CAMSAP), 2009. ↩
- Z. Lin, M. Chen, and Y. Ma. The augmented lagrange multiplier method for exact recovery of corrupted low-rank matrices. arXiv preprint arXiv:1009.5055, 2010. ↩
- B. Recht, M. Fazel, and P.A. Parrilo. Guaranteed minimum-rank solutions of linear matrix equations via nuclear norm minimization. SIAM review, 52(3):471–501, 2010. ↩
- Samuel Burer and Renato Monteiro. A nonlinear programming algorithm for solving semidefinite programs via low-rank factorization. Math. Progam., 2003. ↩
- B. Recht, M. Fazel, and P.A. Parrilo. Guaranteed minimum-rank solutions of linear matrix equations via nuclear norm minimization. SIAM review, 52(3):471–501, 2010. ↩
- Jasson Rennie and Nathan Srebro. Fast maximum margin matrix factorization for collaborative prediction. In ICML, 2005. ↩
- D.P. Bertsekas. Nonlinear programming. Athena Scientific, 1999. ↩