第XVIパンダのデータ分析は、探検しています

インポートPANDAS AS PDの
pd.options.display.max_rows = 10   設定された表示ライン数

DF1 = pd.read_csv(R&LT ' :E \ anacondatest \ PythonData \ PM25 \ Beijing_2009_HourlyPM25_created20140709.csvの'、コード= ' GBK ' 

数値変数基本的な説明の 
df1.describe(含ま= すべてあなたがリストに複数の列を指定した場合、多変量解析を望ん含ま

#のカテゴリ変数のための頻度統計 
pd.value_counts(DF1。タイプ、ソート= False)が
DF1。合計サブ.value_counts(ビン = 10)  統計をセグメント化の

クロスタブ/ピボット 
df1.pivot_table(インデックス= [ '当局 ]、列= タイプ値= スコア「aggfunc = SUM) 

一般的仮説検定
」「」
1標本t検定
t検定二つの独立サンプル
t検定
単一因子分散の分析
カイ二乗検定
相関分析
、回帰分析
試験にノンパラメトリック法
「」 '

 

おすすめ

転載: www.cnblogs.com/kogmaw/p/12563509.html