R 缺失值处理

编程语言 2018-06-20 16:51:41 阅读次数: 2

假设有一组数据集如下：

data=data.frame(y=c(1,2,3,NA,5,6),x1=c(6,NA,4,3,2,1),x2=c(1,3,6,9,12,NA))

“NA”即表示缺失值。

在R中输入该数据。

#判断缺失数据

is.na(data)

#统计缺失值个数

sum(is.na(data))

#查看每个样本数据是否完整，其值与is.na()相反

complete.cases(data)

这里介绍处理缺失值的3种方法。

1、选择无缺失值的记录，代码如下：

data1=data[complete.cases(data),]

2、删除所有有缺失值的记录，这种方法在数据处理中是最常用的。

data2=na.omit(data)

3、替换缺失值。通过一定的统计方法计算出相应值来替换缺失值。一般的方法有：平均值法（最常用）、多重插补法、随机模拟法回归预测（较复杂）。

平均值法如下：

#使用已有值的平均值来代替缺失数据

attach(data)

y[is.na(y)]=mean(y,na.rm=T)

x1[is.na(x1)]=mean(x1,na.rm=T)

x2[is.na(x2)]=mean(x2,na.rm=T)

data=data.frame(y,x1,x2)

猜你喜欢

转载自blog.csdn.net/qq_36330643/article/details/80726842

R 缺失值处理

R语言缺失值处理

R语言的缺失值处理（2）

R语言的缺失值处理(1)

R语言中缺失值NA的处理

R语言缺失值判断以及处理

R语言-数据清洗-缺失值处理

R语言数据缺失值处理

R语言11-缺失值处理

R语言【2.5 缺失值的填补与处理】

R语言处理缺失值数据

R语言之缺失值处理

R-缺失值以及噪声值的判断和处理

数据处理之缺失值处理（R语言）

数据分析中缺失值处理~R语言

使用R来进行缺失值分析与处理

R语言入门：处理缺失值和数据清洗

基于R语言的缺失值及异常值处理

R语言缺失值的处理：线性回归模型插补

R语言| 缺失值的处理方法——多重插补法：利用mice()包

R语言——基础（赋值、输入、截取数据中的一段数据、缺失值处理）

使用R进行缺失值填充

R: 缺失值 & 查看变量类型

【R】填补vector中缺失值

缺失数据处理（R实现）

R语言处理缺失数据（1）-mice

2-6 R语言基础缺失值

R语言入门——NA、NAN、Inf（缺失值的识别）

R语言缺失数据

python缺失值处理

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)