LLE算法的实现细节

作者:禅与计算机程序设计艺术

1.简介

LLE(Locally Linear Embedding)算法是一种无监督降维方法,它可以从高维数据中学习到低维数据的表示形式,而且是局部的,即它仅仅考虑某个样本邻域内的数据点之间的关系,而不是全局的数据的相互联系。该算法通常用于高维空间中的可视化、数据压缩、分类等任务。

本文将对LLE算法进行详细的介绍,并通过具体的代码案例来加深对其工作原理和实现方式的理解。文章基于python编程语言。

1.背景介绍

在很多场景下,我们往往需要对高维的数据进行降维,以便于更好的展示、分析和处理。降维的方法种类繁多,如PCA、SVD等。但这些方法又存在着很大的缺陷:第一,它们假设所有数据都具有相同的方差分布;第二,它们只能找到一个全局最优的投影方向,而忽略了数据内部的不规则结构和复杂的局部信息。

因此,出现了一种新的降维算法——LLE。LLE利用局部信息进行降维,它认为样本的嵌入应该在周围样本的嵌入方向上保持较大的幅度。这种做法既保留了全局和局部信息,也克服了PCA和SVD所带来的局限性。同时,LLE算法不需要进行特征选择或者预先设置降维的维度数。

2.基本概念术语说明

  • 样本点:指原始数据的点,可能是一个二维或三维点,也可能是多维的向量。
  • 邻域:指样本点附近的一组点,该组点的距离足够近,且距离是指欧氏距离或其他任意的距离度量。
  • 距离矩阵

猜你喜欢

转载自blog.csdn.net/universsky2015/article/details/132493529
LLE