机器学习论文笔记（4）

基于分块集成的图像聚类算法

摘要：基于谱聚类的子空间聚类算法已经显示出良好的效果，但是传统的子空间聚类算法需要将图像进行向量化处理，而这种向量化会导致图像本身携带的二维结构信息的丢失。为了减少这种信息的丢失，文中提出了基于分块集成的图像聚类算法。首先，将图像数据分为若干矩阵块；然后，利用核范数矩阵回归构造基于某一矩阵块的系数矩阵，同时提出了一种依据矩阵块秩信息设定各个矩阵块的权重方法；最后，通过每一系数矩阵及其所对应矩阵块的权重，来得到整体系数矩阵。在此系数矩阵上，利用谱聚类算法得到最终的聚类结果。在4个图像数据集上的实验表明，相比于现有算法，所提算法具有更强的鲁棒性，可以获得更优的聚类效果。

引言：在计算机视觉和图像处理领域，高维数据通常被认为散布于几个不同的线性子空间。子空间分割的目标是将数据样本划分到相应的子空间中。在过去的几十年中，许多子空间分割算法被提出。根据文献的总结，现有的子空间分割算法大致可分为四大类: 迭代法、代数法、统计方法和基于谱聚类的方法。其中，基于谱聚类的方法在运动分割和图像恢复等实际应用中取得了巨大的成功，引起了人们的广泛关注。该类方法的子空间分割可以分解为两个步骤: 首先，对一组数据样本构造邻接图; 其次，在构造的邻接图上使用特定的谱聚类算法（如 normalize cut, Ncut）生成最终的分割结果。其中代表性的方法有稀疏子空间聚类（SSC）[17-18]、基于低秩表示的子空间聚类（LRR）[19]、基于最小二乘回归的子空间聚类（LSR）和光滑表示聚类（SRSC） [21]，以及在这些经典算法的基础上加以改进的算法（如结构化低秩表示（SCLRR））等。通过研究发现，上述基于谱图的算法都将数据进行了向量化处理，即将数据样本表示成一高维向量，然后通过向量之间的线性表示得到相似度矩阵。但实际上，向量化对于图像和视频等数据来说会存在如下两方面的问题：（1）信息损失。二维及以上的多维数据样本本身携带的自然结构信息非常丰富，而通过向量化处理将其转化为一维向量后，改变了样本的整体结构特征，从而损失掉了样本原先的某些结构聚类信息。（2）数据向量化处理会导致数据维度变高，因此必要时须采取一定的降维措施，否则可能会导致维数灾难。为了解决上述问题，Yang 等提出了基于核范数的矩阵回归模型（Nuclear Norm based Matrix Regression， NMR）。不同于以前基于一维向量的回归模型，核范数矩阵回归模型 NMR 是一种二维图像矩阵自表示模型。该模型不必事先将图像数据转化为向量，而是在二维图像矩阵的基础上，计算重构误差的核范数。文献的实验结果证明，该方法用于分类能达到非常好的效果。核范数矩阵回归模型的优势可以详细归为以下几点：（1）保留更多的图像信息。直接以矩阵的形式对图像进行处理，避免了矩阵结构的转换，从而减少了由于图像结构变换带来的结构信息损失。（2）具有更强的鲁棒性。作为一种相似度度量，在减少光照等影响方面，核范数比一些线性回归模型中使用的 L2 等范数更具有鲁棒性。（3）去除结构噪声。在损坏的图像中，很显然被遮挡部分或阴影部分的秩是小于整个图像的秩的。当损坏部分的尺寸变大时，噪声像素不稀疏，但误差图像仍然低秩，而且核范数矩阵回归模型可以直接恢复噪声而不需要利用字典。（4）不必单独处理像素误差。 NMR 模型不需要假设像素的表示误差或噪声是独立的，因此也不需要单独处理像素误差，而是通过误差图像的低秩结构，利用核范数对其进行表征。受到核范数矩阵回归用于分类器方面的启发，在核范数矩阵回归的基础上，本文提出基于分块集成的图像聚类算法（ Block Integration Based Image Clustering ， BICI）。 BI-CI 考虑到图像不同子块重要性的不同，对图像预先进行分块，并提出了一种依据矩阵块秩信息来设定各个矩阵块权重的方法，最后通过不同子块得到的邻接图及其权重的加权和获得最终邻接图。本文第 2 节介绍了相关算法和矩阵回归问题；第 3 节提出了分块集成的子空间聚类算法；第 4 节利用本文算法在数据库上进行实验，并与相关算法进行了比较；最后总结本文。

机器学习论文笔记（4）

猜你喜欢