R语言的缺失值处理(2)

用预测来填补。

DMwR包 knnlmputation(),利用knn进行填补,数据集要求剔除因变量,即响应变量。

但是 knnlmputation(),对于因子变量的取值,其效果不是很好。这是可以考虑用回归树

repart函数里边的参数说明,当取值为数值型method用anova,当为因子型用class。

----------------------------------

填补缺失值还可以根据变量之间的相关性:当两两变量存在很强的相关性的时候可以利用回归的方法进行填补,当然,也可以根据强相关的变量的取值趋势进行填补

-------------------------------

猜你喜欢

转载自blog.csdn.net/J_sir2015/article/details/81451788