LDA线性判别原理解析<数学推导> - 代码天地

LDA线性判别原理解析<数学推导>

其他 2018-08-11 05:26:32 阅读次数: 0

LDA (Linear Discriminant Analysis)是机器学习中线性分类模型，本文从以下三个方面进行解析：
一、LDA线性判别的思想
二、LDA求参过程的数学原理
三、LDA实例应用（贝叶斯角度）

LDA分类思想

（1）对于多维空间中的数据处理分类问题较为复杂，LDA算法将多维空间中的数据投影到一条直线上，将 d维数据转化为 1维数据进行处理；

（2）对于训练数据，设法将多维数据投影到一条直线上，是的同类数据的投影点尽可能接近，异类数据点尽可能远离；

（3）在对新数据进行分类时，将其投影到同样的这条直线上，再根据投影点的位置来确定样本的类别。

了解了思想之后我们应当注意到，问题的关键在于如何确定这个投影直线，合适的投影直线的选择将大大提高分类的效果。看下图（图引自博客）：

这里写图片描述

可见上图中对于同样的数据，左图中投影直线的选择显然没有右图中合适。

LDA投影直线确定

假设有一组n个d维的样本x1、x2....xn,他们分别属于两个不同的类别，w1、w2，对x中的成分左线性组合，就可得到点积，结果是一个标量：

上面公式便是投影直线，下面推到如何求解参数 W

这里写图片描述是数据样本的均值向量

这里写图片描述是数据样本的协方差矩阵

、这里写图片描述是两类样本的中心在直线上的投影的中心

这里写图片描述是所有样本投影到直线上，两类样本的协方差

分析为何样本数据均值和协方差投影后是 、这里写图片描述

（1）首先我们知道每个类的均值，这里只有两类：

这里写图片描述

（2）所以当x经过投影直线投射到直线上的均值为：
这里写图片描述

这里写图片描述

（3）同理可以得到投影后样本的协方差

核心思想
重要分析：欲使同类样例的投影点尽可能接近，可以上投影点的协方差尽可能小，欲使异类样例的投影点尽可能远离，可以让类中心之间的距离尽可能大。同时考虑两点，得到欲最大化的目标：

上面公式笔试准则函数，下面通过最大化准则函数来求解参数 W，推导过程如下：
首先定义“类内散度矩阵”：

以及“类间散度矩阵”：

这样准则函数便可写成：

这便是LDA欲最大化的目标，及时Sb和Sw的“广义瑞利熵”

上式中可以观察到分子和分母都是关于W的二次项所以解和w的长度没有关系，之和其方向有关，所以上式可以等价于：

由拉格朗日乘子法：

求导可得到如下式子：

这里简单介绍一下拉格朗日乘子法
拉格朗日乘子法的作用：求函数f(x1,x2…)在g（x1,x2…）=0的约束条件下的极值的方法。
拉格朗日乘子法的操作过程：
（1）定义新函数：

（2）利用偏导方式列出以下方程：
这里写图片描述

这里写图片描述

（3）求解出x，y，σ的值带入F（x,y,σ）便是目标函数的极值

上面我们已经得出了优化准则函数的等价式：这里写图片描述
**关键点：**SbW的方向恒为U0-U1，不妨令：

这里写图片描述

最终可得W的表达式为：
这里写图片描述

这里写图片描述

其中对Sw进行奇异值分解可得：
这里写图片描述

这里写图片描述

因此最终求的参数W，便可得到投影直线方程！

剩下的问题便是根据投影直线求解阈值，也就是一维空间中把两类数据分开的那个点的位置！下面简单说一说。

LDA实例应用

当样本中的数据满足正态分布，即：样本数据的条件概率密度函数P(x|w)是多元正态函数，并且各个类别的协方差矩阵相同时，我们可以直接得到阈值，最佳判别界面的方程为：

这里写图片描述

其中W便是上面求出来的参数，而w0是一个和数据先验概率有关的常数，此点将在我的机器学习系列章节的贝叶斯分类器中详细讨论！

对于更加一般的情况：我们便是对投影后的数据进行平滑处理，或是用以为高斯函数进行拟合，就可以选择使得两个类的后验概率相同的那个位置作为判别边界。

复杂度分析：寻找LDA判别准则下的最佳参数w的计算复杂度主要有计算类内总体散布矩阵和奇异值求解逆矩阵所决定，复杂度为O(d^2*n)

本文参考资料：
【1】Pattern Classification Second Edition
【2】机器学习著周志华
【3】Machine Learining in Action

猜你喜欢

转载自blog.csdn.net/feilong_csdn/article/details/60964027

LDA线性判别原理解析<数学推导>

LDA (线性判别分析）公式推导

LDA 线性判别分析公式推导

线性判别分析LDA原理总结

线性判别分析（LDA）原理

线性判别分析（LDA）原理总结

线性判别结合源码分析LDA原理

LDA-作为线性判别降维推导

白板推导系列Pytorch-线性判别分析（LDA）

线性判别法则（LDA)

机器学习中的数学-线性判别分析(LDA)

线性判别式分析（LDA）原理分析

线性判别分析LDA原理总结（转载）

线性判别分析(LDA)原理及应用详解

LDA-原理解析

线性判别分析（LDA）

LDA线性判别分析

线性判别分析(LDA)

线性判别分析LDA

LDA算法（Fisher线性判别）

用scikit-learn进行LDA降维线性判别分析LDA原理总结

从线性判别分析（LDA）来理解线性分类（linear classifiers）和概率模型（probabilistic modeling）

机器学习中的数学(4)-线性判别分析（LDA）, 主成分分析(PCA)

LDA（线性判别分析）算法

机器学习----线性判别分析LDA

【机器学习】LDA线性判别分析

（二十）线性判别分析（LDA）

LDA 线性判别分析模型

LDA(Fisher)线性判别分析

线性判别分析LDA总结

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)