机器学习---线性判别分析 - 代码天地

机器学习---线性判别分析

企业开发 2023-10-02 20:57:23 阅读次数: 0

1. 基本思想

线性判别分析(Linear Discriminant Analysis, LDA)，也叫做 Fisher 线性判别(Fisher Linear

Discriminant ,FLD)，是模式识别的经典算法，1936年由Ronald Fisher⾸次提出，并在1996年由

Belhumeur引⼊模式识别和⼈⼯智能领域。

线性判别分析的基本思想是将⾼维的模式样本投影到最佳鉴别⽮量空间，以达到抽取分类信息

和压缩特征空间维数的效果。投影后保证模式样本在新的⼦空间有最⼤的类间距离和最⼩的类距

离，即模式在该空间中有最佳的可分离性。

因此，它是⼀种有效的特征抽取⽅法。使⽤这种⽅法能够使投影后模式样本的类间散布矩阵

最⼤，并且同时类内散布矩阵最⼩。

LDA与PCA(主成分分析)都是常⽤的降维技术。PCA主要是从特征的协⽅差⻆度，去找到⽐较

好的投影⽅式。LDA更多的是考虑了标注，即希望投影后不同类别之间数据点的距离更⼤，同⼀

类别的数据点更紧凑。

2. LDA

两个类别，⼀个绿⾊类别，⼀个红⾊类别。下图第一张图是两个类别的原始数据，现在要求

将数据从⼆维降维到⼀维。直接投影到x1轴或者x2轴，不同类别之间会有重复，导致分类效果下

降。下图第二张图映射到的直线就是⽤LDA⽅法计算得到的，可以看到，红⾊类别和绿⾊类别在

映射之后之间的距离是最⼤的，⽽且每个类别内部点的离散程度是最⼩的（或者说聚集程度是最⼤

的）。

下图第一张图：当投影到这条直线时，这两个类没有很好地分开。

下图第二张图：这条线成功地将两个类分开，同时将问题的维数从两个特征（x1，x2）减少到只有

一个标量值y。

LDA是⼀种线性分类器。对于K-分类的⼀个分类问题，会有K个线性函数：

当满⾜条件：对于所有的 j，都有 Yk > Yj 的时候，我们就说 x 属于类别 k。对于每⼀个分类，

都有⼀个公式去算⼀个分值，在所有的公式得到的分值中，找⼀个最⼤的，就是所属的分类。

上式实际上就是⼀种投影，是将⼀个⾼维的点投影到⼀条的直线上，LDA追求的⽬标是，给

出⼀个标注了类别的数据集，投影到了⼀条直线之后，能够使得点尽量的按类别区分开，当k=2即

⼆分类问题的时候，如下图所示：

红⾊的⽅形的点为0类的原始点、蓝⾊的⽅形点为1类的原始点，经过原点的那条线就是投影的直

线，从图上可以清楚的看到，红⾊的点和蓝⾊的点被原点明显的分开了。

3. 优化函数

假设⽤来区分⼆分类的直线（投影函数)为：

LDA分类的⼀个⽬标是使得不同类别之间的距离越远越好，同⼀类别之中的距离越近越好，所以

我们需要定义⼏个关键的值：

类别 i 的原始中⼼点(均值)为：（Di 表示属于类别 i 的点)：

类别 i 投影后的中⼼点为：

衡量类别 i 投影后，类别点之间的分散程度（⽅差）为：

最终我们可以得到⼀个下⾯的公式，表示LDA投影到w后的⽬标优化函数：

分母表示每一个类别内的方差之和，方差越大表示一个类别内的点越分散，分子为两个类别各自的

中心点的距离的平方，我们最大化J（w）就可以求出最优的w。

分类的目标是，使得类别内的点距离越近越好（集中），类别间的点越远越好。

我们定义一个投影前的各类别分散程度的矩阵，其意思是，如果某一个分类的输入点集 Di 里面的

点距离这个分类的中心点 mi 越近，则 Si 里面元素的值就越小，如果分类的点都紧紧地围绕着mi，

则Si里面的元素值越更接近0。

定义：

定义：

化简：

将（1）带入后得：

同样的，将J（w）分子化为：

这样目标优化函数可以化成：

这样就可以用拉格朗日乘子法了，但是还有一个问题，如果分子、分母是都可以取任意值的，

那就会使得有无穷解，将分母限制为长度为1，并作为拉格朗日乘子法的限制条件，带入得到：

这样的式子就是一个求广义特征值的问题了。如果 Sw 可逆，那么将求导后的结果两边都左乘以 Sw 的逆得：

这个可喜的结果就是w就是矩阵的特征向量了。这个公式称为Fisher linear discrimination。

再观察一下，发现前面 SB 的公式：

所以：

带入最后的特征值公式得：

由于对 w 扩大缩小任何倍都不影响结果，因此可以约去两边的常数，得到：

至此，我们只需要求出原始样本的均值和方差就可以求出最佳的方向w，这就是Fisher在1936年提

出的线性判别分析。

猜你喜欢

转载自blog.csdn.net/weixin_43961909/article/details/132354454

机器学习----线性判别分析LDA

【机器学习】LDA线性判别分析

机器学习-线性判别分析

matlab 机器学习线性判别分析

机器学习——线性判别分析

机器学习：线性(Fisher)判别分析

机器学习线性判别分析

机器学习 --- 线性判别分析

机器学习-线性判别分析（LDA）

机器学习---线性判别分析

【机器学习】线性判别分析

机器学习：线性判别分析（fisher判别）

机器学习：线性模型-线性判别分析LDA

【机器学习】LDA（线性判别分析）或fisher判别分析

机器学习方法篇(30)------线性判别分析

机器学习算法（四）：线性判别分析（LDA）

机器学习算法--线性判别分析LDA

机器学习之LDA线性判别分析模型

机器学习入门-线性判别分析（LDA）

机器学习笔记（三）-线性判别分析

机器学习中的数学-线性判别分析(LDA)

传统机器学习-PCA VS LDA（线性判别分析）

机器学习day12线性判别分析

经典机器学习算法：线性判别分析LDA

机器学习笔记：线性判别分析（Fisher）

机器学习（七）：线性判别分析（LDA)

机器学习——LDA（线性判别分析）与人脸识别

机器学习之线性判别分析（Linear Discriminant Analysis）

线性判别分析

（2）机器学习算法——分类问题：线性判别分析（LDA和Fisher判别式）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)