变量投影重要性(VIP)主要用于变量筛选,基于偏最小二乘回归的有点,VIP技术可用于样本较小而且几个自变量间相关性较强的情形。
1.打开SIMCA-P软件,导入excel数据,注意数据格式
第一行是变量名,第一列是序号,自己提前设置好
同时确认一下绿色的代表是变量,黄色代表的是序号
2.设置一下项目名,我这里是SIMCA_111,然后完成![在这里插入图片描述](https://img-blog.csdnimg.cn/2020031714521294.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzYzNzQ5MA==,size_16,color_FFFFFF,t_70)
3.点击工具栏上的workset设置一下参数
右击因变量,选择Y
点击确定后Type会变成PLS
4.点击工具栏的autofit
会出现model view,对我没啥用,关掉
重点来了
5.点击analysis,出现了Variance importance,可以选择图表数据和列表数据
结束
花絮:
作为非数学专业的,为了算这个VIP数值我真的是要哭了,写个论文太难了。刚开始百度变量投影重要性分析说是在偏最小二乘里,好我去找偏最小二乘法的论文,找到了发现说是用SAS软件。我花了一下午装好这个30g的软件,打开后不会使,又百度出代码,结果只显示VIP的柱状图没有具体数值。求爷爷告奶奶找数学专业的同学问问他们会不会,结果他们也不会。本以为就要凉凉,老师告诉我她用的是SIMCA-P软件。好我又去找,找完一步一步对着书上的例子看,最后终于出来了数值,而且和SAS软件比较结果一样。到这我的论文数据部分算结束了,太难了。。。。