数据分析03_Pandas处理缺失值

有两种丢失数据:

None
np.nan(NaN)

1.numpy中的

(1).None

None是Python自带的,其类型为python object。因此,None不能参与到任何计算中。
object类型的运算要比int类型的运算慢得多
计算不同数据类型求和时间
%timeit np.arange(1e5,dtype=xxx).sum()

(2).np.nan(NaN)

np.nan是浮点类型,能参与到计算中。但计算的结果总是NaN。
但可以使用np.nan*()函数来计算nan,此时视nan为0

2.pandas中

(1) pandas中None与np.nan都视作np.nan
(2)pandas中None与np.nan的操作
isnull():一般 isnull()any() 连用
notnull()
dropna(): 过滤丢失数据
fillna(): 填充丢失数据
发布了388 篇原创文章 · 获赞 71 · 访问量 12万+

猜你喜欢

转载自blog.csdn.net/ZZQHELLO2018/article/details/103945138