9.主成分分析

一、用自己的话描述出其本身的含义:

1、特征选择

2、PCA

二、并用自己的话阐述出两者的主要区别

答:

1  特征选择:就是从原本的数据中,单纯地从提取到的所有特征中选择部分

特征作为训练集特征,本身的值没有任何改变,只是选取一部分特征进性训练,

而没有选择的那部分就被抛弃掉。

  PCA:本质就是将数据从一个维度的空间映射到一个维度的空间,不过在

降维的时候,特征数量不会减少,但是特征值会改变,就像是现在的特征是1000

维,我们想要把它降到500维。降维的过程就是找个一个从1000维映射到500维

的映射关系。原始数据中的1000个特征,每一个都对应着降维后的500维空间

中的一个值。假设原始特征中有个特征的值是9,那么降维后对应的值可能是3。

2.两者的区别在于:

  (1)特征选择是选取部分特征,这样子特征数量会减少,PCA是特征数量不会改变。

  (2)特征选取不会使特征值发生改变,PCA会改变特征值

  (3)特征选择适用于特征数量较少的(少于一百),PCA适用于多数量特征的(大于一百)

  

猜你喜欢

转载自www.cnblogs.com/INacl/p/12788161.html