使用R进行缺失值填充

最近逼事一堆,但不得不做,谁让自己XX呢? Stop complaining, and keep moving.

1. R进行缺失值填充

library(readxl)
library(mice)
library(proto)
factory <- read_excel("factory_mice.xls")
# factory <- read.csv("factory_mice.csv")
# 观测factory数据情况
summary(factory)
# 5重插补,使用pmm预测均值匹配
tmpdata <- mice(data,m=5,maxit=50,meth='pmm',seed=500);
# 5次插补填充的缺失数据
tmpdata$imp
# 使用第一次的插补数据进行缺失值填充
data <- complete(tmpdata,1);

进一步的绘图观测及相关其他统计,可见《在R中填充缺失数据—mice包》

猜你喜欢

转载自blog.csdn.net/tb3039450/article/details/78932113