R语言 缺失数据

智齿为什么有人长有人不长,长的概率有多大,为什么我要长智齿!!!
缺失数据的分类

  • 完全随机缺失
  • 随机缺失
  • 非随机缺失
    处理缺失数据之前要了解为何会出现缺失数据
    1.机器断电,导致某个测量值发生了丢失
    2.测量根本没有发生,列如:在调查过程中有些数据没有调查,或者无效
    在R中,NA代表缺失值(不可用),有可能是0有可能为任何值
    在函数中添加na.rm=TRUE可以跳过缺失值后进行计算,并减少缺失值的个数算总数。
    用is.na(x)来检查向量是否含有缺失值,如果有缺失值相应位置上显示TRUE
    去掉数据中的缺失值使用na.omit(x)
    其他缺失数据
    缺失数据NaN,代表不可能的值
    lnf表示无穷,分为正无穷和负无穷,代表无穷大与无穷小
    不同缺失值之间的差别
    NA是存在的值但是不知道是多少
    NaN是不存在的
    lnf存在,是无穷大或者无穷小,但表示不可能的值。
    用is.nan(x)识别不存在的值,is.infinite(x)识别相应的值,返回的也是TRUE or FALSE

猜你喜欢

转载自blog.csdn.net/m0_46445293/article/details/105352881