机器学习（十）：PCA

其他 2018-08-29 21:25:58 阅读次数: 0

1. PCA

1.1 PCA算法

为什么要使用主成分分析？正如名字所示，其目的显而易见，不再赘述，此处从自动编码器的角度审视PCA。
这里写图片描述
最小化如下损失函数：

C = 1 2 m \sum i = 1 m | | y (i) - W W T x (i) | | 2

$C=\frac 1{2m} \sum_{i=1}^m ||y^{(i)}-WW^Tx^{(i)}||^2$ 根据

WWT $WW^T$ 的对称性，我们使用eigen-decompose：

W W T = V D V T

$WW^T=VDV^T$ 其中V是单位正交阵，D是对角矩阵，都是d*d维，

VVT=I $VV^T=I$ ，

D $D$ 中的非零值小于

d¯ $\bar d$ 个。

我们可以从物理意义上来解析 $h(x)$ 到底干了什么：

$V^Tx$ 首先对x进行坐标变换。此处V是d*d维，x是d维，所以此处对应的是将向量x旋转；

$D(V^Tx)$ ，因为D中非零值小于 $\bar d$ 个，所以其作用是将 $\ge (d-\bar d$ 个分量设为0，其余分量进行scale。

$V(DV^Tx)$ 将上述操作后的变量变回原来的坐标系，此处对应的是将向量旋转回来。

| | y - W W T | | 2 = | | V I V T x - V D V T x | | 2 = [V (I V T x - D V T x)] T [V (I V T x - D V T x)] = (I V T x - D V T x) T (I V T x - D V T x) = | | (I - D) V T x | | 2

$||y-WW^T||^2=||VIV^Tx-VDV^Tx||^2=[V(IV^Tx-DV^Tx)]^T[V(IV^Tx-DV^Tx)]=(IV^Tx-DV^Tx)^T(IV^Tx-DV^Tx)=||(I-D)V^Tx||^2$ 那么我们的问题变成：

min V min D 1 2 m \sum i = 1 m | | (I - D) V T x (i) | | 2

$\min_V\min_D\frac 1{2m} \sum_{i=1}^m||(I-D)V^Tx^{(i)}||^2$
首先对内层最小化，很明显

I−D $I-D$ 中的0越多越好：
这里写图片描述

这里写图片描述

接下来我们就外层进行最小化，很明显
这里写图片描述

假设 $\bar d=1$ ,则 $V^T$ 只会保留下第一行 $v^T$ ，则有

m a x v \sum i = 1 m v T x (i) x (i) T v s . t . v T v = 1

$max_v\sum_{i=1}^mv^Tx^{(i)}x^{(i)^T}v\ \ s.t. v^Tv=1$
如何求解？令

J = v T X T X v - λ (v T v - 1)

$J=v^TX^TXv-\lambda(v^Tv-1)$ 令偏微分等于0，有

X T X v = λ v

$X^TXv=\lambda v$ 此时有

m a x v v T X T X v = λ

$max_vv^TX^TXv=\lambda$
什么意思呢？我们只要对

XTX $X^TX$ 进行特征分解即可。
这里写图片描述

这里写图片描述

这里写图片描述

1.2 PCA使用注意事项

这里写图片描述
如果输入的多个维度数值不在同一尺度下，那么可以先将数值都变换到同一尺度。

如何选择 $\bar d$ ？
这里写图片描述

一定要记住，不要过早地使用PCA。
这里写图片描述

猜你喜欢

转载自blog.csdn.net/wangyanphp/article/details/54956072

机器学习（十）：PCA

机器学习（十）：PCA简化数据

机器学习：PCA（降噪）

机器学习之PCA

机器学习_PCA

【机器学习】SVD与PCA

【机器学习】PCA

机器学习 PCA

【educoder 机器学习】PCA

机器学习十大算法（十二）主成分分析（PCA）

机器学习实战之PCA

机器学习—PCA降维

机器学习实战笔记——PCA

机器学习---PCA算法原理

【机器学习】PCA原理分析

机器学习(1) - PCA的理解

机器学习实战PCA算法

机器学习 of python（PCA实例）

《机器学习实战》PCA源码

机器学习：PCA技术以及

【机器学习】PCA、LDA、SVD

【模式识别与机器学习】——PCA与Kernel PCA介绍与对比

机器学习(十三)PCA降维原理

机器学习（降维）PCA原理及实现

《机器学习实战》PCA简化数据

机器学习：PCA（实例：MNIST数据集）

机器学习算法-PCA降维技术

机器学习之PCA降维

机器学习-降维算法(PCA算法)

机器学习之主成分分析PCA

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)