机器学习论文笔记(1)

融合关联矩阵自学习和显式秩约束的数据表示分簇算法

摘要:复杂异构分布的高维数据在大数据时代随处可见,高效地挖掘其子空间结构并进行准确的分簇是机器视觉和模式识别领域的研究热点,低秩表示算法(LRR)因其优越的低维子空间挖掘能力而倍受关注,其性能很大程度上取决于关联矩阵的构建,常见的方法都是通过原始输入数据或表示系数直接一次成型,然而,这些方法都采用独立的步骤进行表示系数计算以及关联矩阵学习,无法保证总体算法的最优性。

针对该问题,本文提出一种新的LRR型数据表示分簇法(Data Represention Clustering,DRC)应用于实际子空间分割问题。

首先, 为实现模型的快速求解,DRC保留基本数据表示框架中的光滑正则项并剔除了非负性、稀疏性等复杂约束;

其次,将相似度矩阵的自适应学习策略添加至统一的数据表示框架,联合原始输入数据和表示系数确保目标关联矩阵在无噪环境下具备明确的对角分布结构;

最后,对关联矩阵对应的Laplacian矩阵添加一种新的秩约束,在含噪环境下引导相似连接结构与簇目标数的一致性。采用交替更新法对模型进行求解,保证目标函数单变量优化的全局最优性以及整体收敛性。

人工合成数据和8个公开数据集的实验结果表明,DRC算法在分簇精度、归一化互信息、参数敏感性等指标上都具有优秀的性能。

关键词:关联矩阵;低秩表示;谱分簇;拉普拉斯正则项;归一化互信息

猜你喜欢

转载自www.cnblogs.com/ZhangWj-/p/12916955.html