数据中缺失值的处理

删除记录

数据插补

插补方法:

  1. 常用的插补方法:均值/中位数/众数插补、使用固定值、最近临插补、回归方法、插值法
  2. 拉格朗日插值法:
    • 对于平面上已知的n个点(无两点在一条直线上)可以找到一个n-1次多项式,使次多项式曲线过这n个点。
    • 将缺失的函数值对应的点x带入插值多项式得到缺失值的近似值
    • 缺点:拉格朗日插值公式结构紧凑,在理论分析中很方便,但是当插值节点增减时,插值多项式就会随之变化,这在实际计算中很不方便,为了克服这一缺点,提出了牛顿插值法。

不处理

拉格朗日插值法的数据,以及python实现为:点击打开链接


猜你喜欢

转载自blog.csdn.net/weixin_38706928/article/details/80298287
今日推荐