pandas-缺失值处理

import  pandas as pd
import numpy as np


df=pd.DataFrame(np.random.rand(10,6) )
df.iloc[1:3,2]=np.nan
df.iloc[4,5:6]=np.nan
df.iloc[5,6:7]=np.nan

# isnull 对df的每个值进行判断,返回true or false

#print(df.isnull())

# isnull().any() 判断哪几列有null值
#print(df.isnull().any())

# 判断哪些行存在缺失值

#print(df.T.isnull().any())

# 只显示存在缺失的行
#print(df[df.isnull().values==True])

#print(df[df.isnull().values==True].index)

#缺失值处理-丢弃 dropna()

#print(df.dropna(axis=1))  # axis=1 表示丢弃列后的df 默认 axis=0,丢弃行

# 填充

#print(df.fillna(0))
#print(df.fillna(df.mean(axis=0)))
#print(df)
#print(df.fillna(method='pad')) # 用前一个数进行替换,缺失值同列上一行的数字进行补充
#print(df.fillna(method='bfill')) # 同列下一行的数字进行补充
print(df.fillna(df.interpolate())) #插值填充

猜你喜欢

转载自blog.csdn.net/huangqihao723/article/details/82193783