NMF非负矩阵分解

参考文献:Lee D D , Seung H S . Learning the Parts of Objects by Non-Negative Matrix Factorization[J]. Nature, 1999, 401(6755):788-791.

这篇文章是NMF首先被提出的文章,1999年发表于《Nature》。

NMF即非负矩阵分解,是一种(非线性)降维的方法,常用于文本和图像的降维(非负)。它能够提取出原始数据中的“局部”特征,这与PCA和VQ(矢量量化)是不同的,下图比较清楚的在展示了三种方法的结果上的区别,红色表示负值。

在这里插入图片描述

V:n*m的原始矩阵,每一列是一张图像的数据,包含n个非负像素值,共m张图像;

W:n*r的矩阵,称为基本图像(basic images),可解释为原始图像的r个构成部分。

H:r*m的矩阵,每一列是一张图的编码(系数);

–>V中的每一张图可以表示为基本图像的线性组合。

W和H中的元素需要满足非负性约束,且对于r的选择一般有(n+m)r<nm,即达到了压缩的目的(可通过PCA的结果选择r)。

NMF的基本图像W和图像编码H都比较稀疏:每个基本图像都只是面部的一部分;给定的一张脸不会用到所有的基本图像。

目标函数
在这里插入图片描述
该目标函数可以通过将NMF解释为构建图像生成概率模型的方法来得出。将压缩图像的还原过程看做WH上加一泊松噪音。则该目标函数与从W和H生成图像V的似然有关。

更新方法:

在这里插入图片描述

对图像生成(还原)过程的理解:

在这里插入图片描述
与SVD算法的比较

​ 非负矩阵分解的特征向量存在信息冗余,但可解释性强,在分解过程中基数目需要预先确定,与原始矩阵的近似程度只能在欧氏距离上达到局部最小而非全局最小,受初始值影响明显。

与主成分分析方法的比较

​ 非负矩阵分解的数学实现简便、分解形式和分解结果更易解释、以及占用存储空间少,更重要的是非负限制与联系部分形成整体的直觉概念相协调,这与智慧生命对事物感知的生理过程相符合。

发布了5 篇原创文章 · 获赞 4 · 访问量 440

猜你喜欢

转载自blog.csdn.net/m0_37544963/article/details/105049979