Pythonの-Pandasを使用してデータ解析(パートVI - パケットデータ集約操作)

  データセットと各機能(ポリマー又は変換するかどうか)のためのアプリケーションのセットをグループ化することは、通常、データ分析の重要な部分です。データセットをロードした後、融合、準備ができて、通常統計演算パケット又は生成ピボットテーブル。パンダは自然な方法でデータセットにスライス、サイコロ、要約およびその他の操作にあなたを可能にする柔軟かつ効率的なGROUPBY機能を提供します。

  SQLリレーショナルデータベースなどの人気することができる理由の一つは、簡単にデータ、フィルタリング、変換、および凝集に接続することが可能です。しかし、そのようなSQLクエリ言語のグループ化操作の一種のような非常に限らを行うことができます。このセクションでは、Pythonと表現力のパンダは、我々ははるかに複雑なグループ化計算(numpyの配列パンダ受け入れることができます任意のオブジェクトや関数を使用して)を行うことができますが表示されます。このセクションでは、学びます。

  • パケットは、カウント、平均、標準偏差、またはユーザ定義関数としての要約統計量を計算します。
  • 要約統計量は、数平均または標準偏差、またはユーザ定義関数として、パケットを算出しました。
  • そのような正規化、線形回帰、またはランクなどのサブセットを選択するような他の基または変換操作のアプリケーション。
  • 計算テーブルまたはクロステーブルの観点。
  • サブグループは、クォンfenyiおよびその他の統計の実装を分析します。

1、GROUPBY機構

  Hadlleyウィッカム(多くの人気R言語パックの作者)

 

 

おすすめ

転載: www.cnblogs.com/lsyb-python/p/12020483.html