python缺失值处理

null/None/NaN
null经常出现在数据库中
None是python中的缺失值,类型是NoneType
NaN也是python中的缺失值,意思是不是一个数字,类型是float
在pandas和Numpy中会将None替换为NaN,而导入数据库中的时候则需要把NaN替换成None

  • 找出空值
    isnull()
    notnull()

  • numeric容器会把None转换为NaN

In [20]: s = pd.Series([1, 2, 3])

In [21]: s.loc[0] = None

In [22]: s
Out[22]: 
0    NaN
1    2.0
2    3.0
dtype: float64`
  • object容器会储存None
In [20]: s = pd.Series([1, 2, 3])

In [21]: s.loc[0] = None

In [22]: s
Out[22]: 
0    NaN
1    2.0
2    3.0
dtype: float64
  • GroupBy

在分组中会忽略空值

  • 填充空值
    fillna

  • 值替换
    replace

  • 删除空值行或列
    DataFrame.dropna(axis=0, how=’any’, thresh=None, subset=None, inplace=False)

猜你喜欢

转载自blog.csdn.net/qq_34739497/article/details/80055074