有两种丢失数据:
None
np.nan(NaN)
1.numpy中的
(1).None
None是Python自带的,其类型为python object。因此,None不能参与到任何计算中。
object类型的运算要比int类型的运算慢得多
计算不同数据类型求和时间
%timeit np.arange(1e5,dtype=xxx).sum()
(2).np.nan(NaN)
np.nan是浮点类型,能参与到计算中。但计算的结果总是NaN。
但可以使用np.nan*()函数来计算nan,此时视nan为0
2.pandas中
(1) pandas中None与np.nan都视作np.nan
(2)pandas中None与np.nan的操作
isnull():一般 isnull()和any() 连用
notnull()
dropna(): 过滤丢失数据
fillna(): 填充丢失数据