データサイエンスライブラリ-day2

1頭のパンダ2つの一般的なデータタイプ:シリーズとデータフレーム

2シリーズを作成します。

    pd.Series用のS =(1,2、np.nan、8])

3データフレームを作成します。

    作成する列の数で:

日付= pd.date_range( '20130301'、期間= 6)

                  DF = pd.DataFrame(np.random.randn(6,3)、インデックス=日付、列= 'ABC')

    辞書作成者:

DF2 = pd.DataFrame({ 'A':1、

'B':pd.Timestamp( '20130301')、

'C':pd.Series(1、インデックス=リスト(範囲(4))、DTYPE = 'のfloat32')、

'D':np.array([3] * 4、DTYPE = 'INT32')、

'E': 'FOO'})

4データを表示する(例DF2します)

    n個前の表示:df2.head(N)

    df2.tail(N):N尾のラインをチェック

    表示値:df2.values

    ビュー統計説明:df2.describle()

    トランスポーズ:df2.Tを

    カラムを降順で並べ替え:df2.sort_index(軸= 1、昇順=偽)\

    カラムの値によってソート:df2.sort_values(=「C」で)

5 [データ

    列選択:DF2 [ 'A']

    df2.loc:インデックスで

    デジタルタグ:df2.iloc [1,2]

ブールインデックス:DF2 [DF2 [ 'A']> 2]

6つの欠損値

    df2.dropna(方法= '任意の')

    df2.fillna(値= 5)

数学と統計の7

    df2.mean(軸= 0)

アプリケーションの機能:df2.apply(np.consum)

統計の数:s.value_counts()

8マージ

    pd.concat([DF1、DF2、DF3]、軸= 1)

9増加行

    df2.append(S)

10個のパケット

    df2.group( 'A')。合計()

11ピボットテーブル

   pd.pivot_table(DF2、値= 'A'、インデックス= [ 'B'、 'C​​']、列= 'D')

12時系列

    T1 = pd.date_range( '/ 2017分の1 1'、期間= 12、FREQ = 'T')

おすすめ

転載: www.cnblogs.com/zhuome/p/11595112.html
おすすめ