分享一篇来自JAMA(IF=51)的NHANES数据插补方法

美国国家健康与营养调查( NHANES, National Health and Nutrition Examination Survey)是一项基于人群的横断面调查,旨在收集有关美国家庭人口健康和营养的信息。
地址为:https://wwwn.cdc.gov/nchs/nhanes/Default.aspx
使用过nhanes数据库的都知道,nhanes数据库有些变量存在大量缺失值,容易导致分析结果偏差,对数据进行插补为一种有效的方法。
在这里插入图片描述
我们在文章《nhanes数据库挖掘教程3–对数据进行多重插补》中已经初步介绍了,近期粉丝向我推荐了一篇JAMA的文献。今天咱们试着复现一下这篇文献的插补方法,并和上面文章的插补方法进行一个对比。
继续使用咱们之前文章《nhanes数据库挖掘教程3–对数据进行多重插补》中采集的nhanes数据,
我们先导入数据

bc<-read.csv("E:/nhanes/nhanes.csv",sep=',',header=TRUE)

在这里插入图片描述
我介绍一下数据,SEQN:序列号,RIAGENDR, # 性别, RIDAGEYR, # 年龄,RIDRETH1, # 种族,DMDMARTL, # 婚姻状况,WTINT2YR,WTMEC2YR, # 权重,SDMVPSU, # psu,SDMVSTRA,# strata,LBDGLUSI, #血糖mmol表示,LBDINSI, #胰岛素( pmmol/L),PHAFSTHR #餐后血糖,LBXGH #糖化血红蛋白,SPXNFEV1, #FEV1:第一秒用力呼气量,SPXNFVC #FVC:用力肺活量,ml(估计肺容量),LBDGLTSI #餐后2小时血糖。
可以看到很多数据存在缺失值

本文为转载文章,全文地址如下:https://mp.weixin.qq.com/s?__biz=MzI1NjM3NTE1NQ==&mid=2247488786&idx=1&sn=098b521e4c80b5c7d02464a019a752e2&chksm=ea26f50edd517c18d99927ab2885658cbe152ab6f4789bf0911d67fa200fe3c3f272260d9890#rd

猜你喜欢

转载自blog.csdn.net/dege857/article/details/132003297