python pandas空值与缺失值处理

一、空值与缺失值

空值:在pandas中的空值是""

缺失值:在dataframe中为nan或者naT(缺失时间),在series中为none或者nan

二、相关处理函数:
df.dropna()

df.fillna()

df.isnull()

df.isna()

三、函数解释:
1. DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

  • 函数作用:删除含有空值的行或列
  • axis:维度,axis=0表示index行,axis=1表示columns列,默认为0
  • how:"all"表示这一行或列中的元素全部缺失(为nan)才删除这一行或列,"any"表示这一行或列中只要有元素缺失,就删除这一行或列
  • thresh:一行或一列中至少出现了thresh个才删除。
  • subset:在某些列的子集中选择出现了缺失值的列删除,不在子集中的含有缺失值得列或行不会删除(有axis决定是行还是列)
  • inplace:刷选过缺失值得新数据是存为副本还是直接在原数据上进行修改。


2. DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

  • 函数作用:填充缺失值
  • value:需要用什么值去填充缺失值
  • axis:确定填充维度,从行开始或是从列开始
  • method:ffill:用缺失值前面的一个值代替缺失值,如果axis =1,那么就是横向的前面的值替换后面的缺失值,如果axis=0,那么则是上面的值替换下面的缺失值。backfill/bfill,缺失值后面的一个值代替前面的缺失值。注意这个参数不能与value同时出现
  • limit:确定填充的个数,如果limit=2,则只填充两个缺失值。

3. DataFrame.isna()和DataFrame.isnull()

  • 函数作用:判断是不是缺失值
发布了89 篇原创文章 · 获赞 68 · 访问量 32万+

猜你喜欢

转载自blog.csdn.net/symoriaty/article/details/100178326