NMF分解(二)

应用:

一、图像分析

NMF最成功的一类应用是在图像的分析和处理领域。图像本身包含大量的数据,计算机一般将图像的信息按照矩阵的形式进行存放,针对图像的识别、分析和处理也是在矩阵的基础上进行的。这些特点使得NMF方法能很好的与图像分析处理相结合。人们已经利用NMF算法,对卫星发回的图像进行处理,以自动辨别太空中的垃圾碎片;使用NMF算法对天文望远镜拍摄的图像进行分析,有助于天文学家识别星体;美国还尝试在机场安装由NMF算法驱动的识别系统,根据事先输入计算机 的恐怖分子的特征图像库来自动识别进出机场的可疑恐怖分子。

学术界中:(1)NMF首次被Lee教授用于处理人脸识别。等等

二、话题识别

文本在人类的日常接触的信息中占有很大分量,为了更快更精确的从大量的文本数据中取得所需要的信息,针对文本信息处理的研究一直没有停止过。文本数据不光信息量大,而且一般是无结构的。此外,典型的文本数据通常以矩阵的形式被计算机处理,此时的数据矩阵具有高维稀疏的特征,因此,对大规模文本信息进行处理分析的另一个障碍便是如何消减原始数据的维数。NMF算法正是解决这方面难题的一种新手段。NMF在挖掘用户所需数据和进行文本聚类研究中都有着成功的应用例子。由于NMF算法在处理文本数据方面的高效性,著名的商业数据库软件Oracle在其第十版中专门利用NMF算法进行文本特征的提取和分类。为什么NMF对文本信息提取的很好呢?原因在于智能文本处理的核心问题是以一种能捕获语义或相关信息的方式来表示文本,但是传统的常用分析方法仅仅是对词进行统计,而不考虑其他的信息。而NMF不同,它往往能达到表示信息的局部之间相关关系的效果,从而获得更好的处理结果。

话题识别的话跟probabilistic Latent Semantic Analysis概率隐语义分析相似

首先假设是一个单词-文件的矩阵,是单词在文件的出现频率:

假设

那么模型可变成:

在这里,可以被解释成为与数据的主题相关度

猜你喜欢

转载自www.cnblogs.com/zhibei/p/9373517.html
今日推荐