统计学习方法读书笔记(十六)-主成分分析

全部笔记的汇总贴:统计学习方法读书笔记汇总贴

PDF免费下载:《统计学习方法(第二版)》

主成分分析(principal component analysis, PCA)是一种常用的无监督学习方法,这一方法利用正交变换把由线性相关变量表示的观测数据转换为少数几个由线性无关变量表示的数据,线性无关的变量称为主成分。

一、总体主成分分析

数据的变量之间可能存在相关性,以致增加了分析的难度。考虑由少数不相关的变量来代替相关的变量,用来表示数据,并且要求能够保留数据中的大部分信息。

在这里插入图片描述
在这里插入图片描述

主成分分析的主要目的是降维,所以一般选择 k ( k < < m ) k (k <<m) k(k<<m)个主成分(线性无关变量)来代替 m m m个原有变量 (线性相关变量),使问题得以简化,井能保留原有变量的大部分信息。

二、样本主成分分析

在这里插入图片描述
可以对照例16.1。

在这里插入图片描述
在这里插入图片描述

下一章传送门:统计学习方法读书笔记(十七)-潜在语义分析

猜你喜欢

转载自blog.csdn.net/qq_41485273/article/details/113094096