吴恩达机器学习（第十五章）---降维PCA

编程语言 2018-11-04 15:40:49 阅读次数: 0

一、目标

1.数据压缩

在机器学习中，会用到大量数据进行学习训练，当数据量很大，维度高时，对电脑内存的压力会很大，并且学习的速度也会很慢。

2.可视化

我们将一些高维的数据降维到1维，2维，3维的话，就可以进行可视化，将数据以图表的方式展示出来。

二、主成分分析方法

主成分分析方法（Principal Component Analysis (PCA)）是目前比较流行的进行降维的算法。

1.主要思想：

找一个向量，使得所有数据点到这个向量的距离（投影误差）最小。

2.线性回归与PCA的区别

pca 线性回归

两者的区别就在于，线性回归是求数据点对其对应在函数上的点之间的误差，是点与点之间的距离；而PCA是求点到直线的距离

三、预处理

在使用PCA之前要先进行预处理-----均值标准化

这个均值化和特征缩放类似，都是为了让所有数据都在一个较小范围内。

$\mu_j=\frac{1}{m}\sum_{i=1}^{m}{x_j^i}$ 求得的u是每一个数据的所有特征的平均值，然后 $x_j=x_j-\mu_j$ ,如果不同的特征之间差的比较大的话，可以将上式改写为 $x_j=\frac{x_j-\mu_j}{s_j}$ (s_j是x_j的标准差)

四、PCA计算过程

1.求该矩阵的协方差 $\Sigma=\frac{1}{m}\sum_{i=1}^{m}{(x^i)(x^i)^T}$

2.用[U,S,V]=svd(sigma)对上式结果奇异值分解

3.我们得到的U是n*n的矩阵（n是向量x^i的维度），我们想要降维到k维的向量上，那么就取U的前k列向量。

4. $z^i=U_{reduce}^Tx^i$ , $U_{reduce}^T$ 为k*n维,求得的z就是最终结果。

注：奇异值分解还在学习中，所以无法给出解释，还是个小菜鸡

五、k的选择

k不能随意选择，否则误差会很大。

1.通常我们用下式进行判断

当其小于0.01的时候我们认为这个k值是可以使用的，当然这个0.01不是绝对的，也可以是0.05，0.1等等，是根据个人而定。x_approx(是z通过压缩重现得到的x的近似值，z_approx=U_reduce*z)

2.也可以使用[U,S,V]=svd(sigma)

$1-\frac{\sum_{i=1}^{k}{S_{ii}}}{\sum_{i=1}^{n}{S_{ii}}}\leq 0.01$

猜你喜欢

转载自blog.csdn.net/naocanmani/article/details/83615078

吴恩达机器学习（第十五章）---降维PCA

吴恩达机器学习——第15章降维

吴恩达机器学习 - PCA算法降维

《吴恩达机器学习》14 降维（PCA算法）

吴恩达机器学习笔记——降维与PCA算法

吴恩达《机器学习》——PCA降维

吴恩达机器学习 - PCA算法降维吴恩达机器学习 - PCA算法降维

吴恩达-coursera-机器学习测试题第十五章-异常检测

第十五章异常检测-机器学习老师板书-斯坦福吴恩达教授

[吴恩达机器学习笔记]14降维3-4PCA算法原理

吴恩达机器学习（十二）主成分分析（降维、PCA）

吴恩达机器学习（八）聚类与降维（K-Means，PCA）

吴恩达机器学习训练秘籍整理三十三到三十五章（五）

【吴恩达】机器学习第14章PCA以及ex7PCA编程练习

第十四章-降维之主成分分析法(PCA) 深度之眼_吴恩达机器学习作业训练营

第十五章-异常检测算法深度之眼_吴恩达机器学习作业训练营

吴恩达《机器学习》课程总结（14）降维

吴恩达机器学习笔记 —— 15 降维

吴恩达机器学习笔记7-降维

吴恩达《机器学习》课程总结(14)_降维

吴恩达机器学习（十四）——降维

吴恩达-coursera-机器学习测试题第十四章-降维

第十四章降维操作-机器学习老师板书-斯坦福吴恩达教授

吴恩达--降维

吴恩达机器学习笔记（十五）

【吴恩达】机器学习第5章学习收获

【吴恩达】机器学习第19章学习收获

【吴恩达】第12章机器学习学习收获

【吴恩达】机器学习第11章学习收获

机器学习笔记（参考吴恩达机器学习视频笔记）13_降维

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)