1頭のパンダ2つの一般的なデータタイプ:シリーズとデータフレーム
2シリーズを作成します。
pd.Series用のS =(1,2、np.nan、8])
3データフレームを作成します。
作成する列の数で:
日付= pd.date_range( '20130301'、期間= 6)
DF = pd.DataFrame(np.random.randn(6,3)、インデックス=日付、列= 'ABC')
辞書作成者:
DF2 = pd.DataFrame({ 'A':1、
'B':pd.Timestamp( '20130301')、
'C':pd.Series(1、インデックス=リスト(範囲(4))、DTYPE = 'のfloat32')、
'D':np.array([3] * 4、DTYPE = 'INT32')、
'E': 'FOO'})
4データを表示する(例DF2します)
n個前の表示:df2.head(N)
df2.tail(N):N尾のラインをチェック
表示値:df2.values
ビュー統計説明:df2.describle()
トランスポーズ:df2.Tを
カラムを降順で並べ替え:df2.sort_index(軸= 1、昇順=偽)\
カラムの値によってソート:df2.sort_values(=「C」で)
5 [データ
列選択:DF2 [ 'A']
df2.loc:インデックスで
デジタルタグ:df2.iloc [1,2]
ブールインデックス:DF2 [DF2 [ 'A']> 2]
6つの欠損値
df2.dropna(方法= '任意の')
df2.fillna(値= 5)
数学と統計の7
df2.mean(軸= 0)
アプリケーションの機能:df2.apply(np.consum)
統計の数:s.value_counts()
8マージ
pd.concat([DF1、DF2、DF3]、軸= 1)
9増加行
df2.append(S)
10個のパケット
df2.group( 'A')。合計()
11ピボットテーブル
pd.pivot_table(DF2、値= 'A'、インデックス= [ 'B'、 'C']、列= 'D')
12時系列
T1 = pd.date_range( '/ 2017分の1 1'、期間= 12、FREQ = 'T')