一、用自己的话描述出其本身的含义:
1、特征选择
2、PCA
1.特征选择是从给定的特征集合中选出相关特征使得系统特定指标最优化的过程,作用在于降低数据集维度,从而获得分类错误概率小的分类特征。
2.PCA 主要用于数据降维,利用现有特征构建新的特征,使它们反映事物的主要特征,压缩原有数据矩阵的规模,将特征向量的维数降低,挑选出最少的维数来概括最重要特征。
二、并用自己的话阐述出两者的主要区别
特征选择是从包含多个特征的数据集中挑选出几个特征作为实际使用的数据集,没有改变特征的形式。
PCA是用于减少数据集的维度,同时保持数据集中使方差贡献最大的特征。改变了原来特征的形式。