[データ解析]パンダの研究ノートは、統計計算と統計的計算は合計、平均、最大値、最小+ +一般的に使用される統計的記述は+説明統計共通の統計的方法を複数生成+ DESCRIBE一般+に記載day16

統計計算と説明パンダ

サンプルコード:

import numpy as np
import pandas as pd

df_obj = pd.DataFrame(np.random.randn(5,4), columns = ['a', 'b', 'c', 'd'])
print(df_obj)

結果:

          a         b         c         d
0  1.469682  1.948965  1.373124 -0.564129
1 -1.466670 -0.494591  0.467787 -2.007771
2  1.368750  0.532142  0.487862 -1.130825
3 -0.758540 -0.479684  1.239135  1.073077
4 -0.007470  0.997034  2.669219  0.742070

一般的に使用される統計計算

合計、平均値、最大値、最小...

軸= 0カラム統計、軸= 1行の統計によると

skipnaは、欠損値を除外し、デフォルトはTrueです

サンプルコード:

df_obj.sum()

df_obj.max()

df_obj.min(axis=1, skipna=False)

結果:

a    0.605751
b    2.503866
c    6.237127
d   -1.887578
dtype: float64

a    1.469682
b    1.948965
c    2.669219
d    1.073077
dtype: float64

0   -0.564129
1   -2.007771
2   -1.130825
3   -0.758540
4   -0.007470
dtype: float64

一般的に使用される統計的記述

統計データを複数生成説明

サンプルコード:

print(df_obj.describe())

結果:

              a         b         c         d
count  5.000000  5.000000  5.000000  5.000000
mean   0.180305  0.106488  0.244978  0.178046
std    0.641945  0.454340  1.064356  1.144416
min   -0.677175 -0.490278 -1.164928 -1.574556
25%   -0.064069 -0.182920 -0.464013 -0.089962
50%    0.231722  0.127846  0.355859  0.190482
75%    0.318854  0.463377  1.169750  0.983663
max    1.092195  0.614413  1.328220  1.380601

一般的に使用される統計的方法が記載されています。

[画像ソースステーションは、セキュリティチェーン機構を有していてもよい、チェーンが失敗したダンプ、それは直接アップロードダウン画像を保存することをお勧めします(IMG-Wwg2V2X2-1579957468049)(../画像/ pandas_tongji1.png)] [画像外側リンクに障害が発生したダンプ、ソースステーションは、画像を保存することが推奨され、盗難防止チェーン機構を有していてもよい(IMG-tfJ1062I-1579957468051)(../画像/ pandas_tongji2.png)]ダウン直接アップロード

彼は192元の記事を発表 ウォン称賛56 ビュー10000 +

おすすめ

転載: blog.csdn.net/qq_35456045/article/details/104084793