版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xuxiatian/article/details/86686840
1. 检测
有如下dataframe,先用df.isnull().sum()
检查下哪一列有多少NaN:
import pandas as pd
df = pd.DataFrame({'a':[None,1,2,3],'b':[4,None,None,6],'c':[1,2,1,2],'d':[7,7,9,2]})
print (df)
print (df.isnull().sum())
输出:
2. 去除
将含有NaN的列(columns)去掉:
data_without_NaN =df.dropna(axis=1)
print (data_without_NaN)
输出:
3. 对于inf我们可以先将其替换成nan,或者在文件开头加入设置语句:
pd.set_option('mode.use_inf_as_na', True)