NaNの中でどのように任意の値パンダのデータフレームをチェックします
この記事はから来て codeday 、著者codeday
ではPythonの パンダ、データフレームが最善の方法は何であるかどうかを確認します(またはそれ以上)のNaN値はありますか?
私は、関数pd.isnanを知っているが、それは各要素のブールデータフレームを返します。 このPOSTここに完全に私の質問に答えではありません。
ベストの答え
jwilnerの応答は...(妙)平面アレイを見つけるコードがより速くなるように思われるよりも速く数え、私は速く選択肢があるため、私の経験では、存在するかどうかを模索したスポットです。
df.isnull().values.any()
コードをコピー
例えば:
In [2]: df = pd.DataFrame(np.random.randn(1000,1000))
In [3]: df[df > 0.9] = pd.np.nan
In [4]: %timeit df.isnull().any().any()
100 loops, best of 3: 14.7 ms per loop
In [5]: %timeit df.isnull().values.sum()
100 loops, best of 3: 2.15 ms per loop
In [6]: %timeit df.isnull().sum().sum()
100 loops, best of 3: 18 ms per loop
In [7]: %timeit df.isnull().values.any()
1000 loops, best of 3: 948 ?s per loop
コードをコピー
df.isnull()。合計()。合計()、その他の情報の少し遅いが、そこに当然の-NaN数。