主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。
当研究的问题涉及到多变量且变量之间存在很强的相关性时使用
不可用于评价类模型
思想
第一主成分感觉一般都是综合成分
计算步骤(写入论文)
- 计算上面的 X 矩阵的相关系数矩阵 R
- 计算 R 的特征值和特征向量
- 计算累计贡献率(超过 80% 的选为主成分)
- 进行解释
主成分的解释的例子
主成分分析用于聚类
先用 matlab 代码计算出选择几个主成分,再把计算了主成分的值之后的数据导入 SPSS ,先聚类分析画出谱系图,从谱系图看准备分成几类;然后再做一次聚类分析,在“保存”选项中输入要分的类数,最后根据分类结果在 SPSS 中画图
主成分分析用于回归
先用 matlab 代码计算出选择几个主成分,再把计算了主成分的值之后的数据导入 stata 进行回归,检验异方差等