NaNの中でどのように任意の値パンダのデータフレームをチェックします

NaNの中でどのように任意の値パンダのデータフレームをチェックします

この記事はから来て codeday 、著者codeday

ではPythonの  パンダ、データフレームが最善の方法は何であるかどうかを確認します(またはそれ以上)のNaN値はありますか?

私は、関数pd.isnanを知っているが、それは各要素のブールデータフレームを返します。  このPOSTここに完全に私の質問に答えではありません。

ベストの答え

jwilnerの応答は...(妙)平面アレイを見つけるコードがより速くなるように思われるよりも速く数え、私は速く選択肢があるため、私の経験では、存在するかどうかを模索したスポットです。

 

df.isnull().values.any()
コードをコピー

例えば:

 

In [2]: df = pd.DataFrame(np.random.randn(1000,1000))

In [3]: df[df > 0.9] = pd.np.nan

In [4]: %timeit df.isnull().any().any()
100 loops, best of 3: 14.7 ms per loop

In [5]: %timeit df.isnull().values.sum()
100 loops, best of 3: 2.15 ms per loop

In [6]: %timeit df.isnull().sum().sum()
100 loops, best of 3: 18 ms per loop

In [7]: %timeit df.isnull().values.any()
1000 loops, best of 3: 948 ?s per loop
コードをコピー

df.isnull()。合計()。合計()、その他の情報の少し遅いが、そこに当然の-NaN数。

公開された296元の記事 ウォンの賞賛221 ビュー540 000 +

おすすめ

転載: blog.csdn.net/qq_36387683/article/details/102852178