パンダ関連の操作

インポートPANDAS AS PD
 インポートNP AS numpyの
 「」 ' 
DF作成。
    1.定義DF:辞書送信
    【:配列キー各キーの値としてキー配列を有する各列1.1の名前を
    1.2ネスト辞書生成DFをクラスキー列名名などの要素の二列の重要な要素として
    1.3 pd.DataFrame DF(辞書、列は= [「KEY1」、「KEY2」])作成] 
    1.4 DF指定されたラベルを(インデックス)pd.DataFrame (辞書、列は= [ 'KEY1'、 'KEY2']、インデックス= [ 'つ'、 'TWO'、 `` `])
    
    2.定義DF:インデックスデータ行列+カラム+ 
    2.1直接値タグに列名pd.DataFrame(np.arange(16).reshape( 4,4)、インデックス= [ '1'、 '2'、...]、列= [ 'オブジェクト'、 ''、..] 
    
II。エレメントを選択
    値1 
    1.1 [カラム名タグ値frame.columnsのframe.valuesを参照] frame.index 
    [[ 'フレームを取る1.2物体1' 、 'オブジェクト2'] frame.object 
    1.3取行フレーム[1:3]
    1.4つの値のフレーム[ 'オブジェクト'] [2かかり -----] DF ----シリーズインデックス値
    
    2.割り当て
    
    NAME = 'ID' frame.columns.name、ランクタグ名frame.index 2.1 = 「項目」
    2.2フレーム[「新」] = 12翻訳フレームを追加[「新しい新しい」] = [12,12,12,12] 
    2.3フレームを変更[「新しい新しい」] =シリーズ     
    2.4単一値DFを修正-カラムシリーズ-指標枠[ '新しい新規'] [2] = 3 
    
    
    3. DFの要素かどうかを判定する
    
    3.1 frame.isinのDF =(1.0、 'PEN'])
    
    4.削除カラム
    4.1デルフレーム【 '新しいです' ] 
    
    5.フィルタ
    5.1すべてのフィルタフレーム[フレーム<12である] 
    列フレームの5.2スクリーニング[frame.new <12]は
    
    6転置
    frame.T   
    
オブジェクト.INDEX 3  
    1.重複インデックスserd.index.is_uniqueフレームかどうかを決定します。index.is_unique
    重複インデックスSERD 2. [「重複インデックスを」]シリーズフレーム[「重複インデックス」]バックフレームを返します。
    3.Series.reindex([索引配列]、方法= 'ffill') frame.reindex([ ランキング配列]、メソッド= 'ffill'、列= [ ''、 ''、....])
    
    4.削除ドロップ()リターン[新しいオブジェクトの削除されたインデックスと要素を除く] ser.drop([「」、「」 ]) 複数のインデックスを削除し、アレイ入力が使用
    行を削除:Frame.drop([「」、「 」 、「」])
    列を削除:Frame.drop([「」、「」、「」] = 1軸)
    
    5データ要素クラスとその動作(プラス)
    
    4.1オブジェクトは、対応する、ラベルの2つのシリーズを持っていますデータオブジェクトが一部のみ充填率NaNに添加される、請求
    4.2二つのオブジェクトフレームのフレームはNaNを添加することによって、インデックス要素およびその逆に対応する2つの列が満たされた
    
データ構造との間の四則    
    1マス(要素レベル) :[]満足ブロードキャスト機構
    a.add(B)
    サブ()
    DIV()
    MUL()
    
。[マッピング関数アプリケーションと5つのライブラリ] 
    1機能素子の動作(一般機能)
        ##当たりnp.sqrt(フレーム)平方根要素 - X。分() 
    frame.apply(F)は、行を計算している### 
    関数演算2.ランク
    ラムダX = F:x.max() - x.min()
    frame.apply(F、軸= 1)###列演算により
    
    戻り値の2.1複数
    DEF F(X):
        戻りpd.Series([X .MAX()、x.min()]、インデックス= [ '分'、 '最大'])
    frame.apply(F)
    
    3.統計関数
    frame.sum()
    frame.mean()
    frame.describe()
    
    
    4.ソート
    
    4.1 ser.sort_index()
    4.2 ser.sort_index(軸= 1)
    4.3 frame.sort_index()
    4.4 frame.sort_index(軸= 1)
    
    (=による[ 'columns1'、 'columns2'])4.4 frame.sort_index 
    
    予選回ランキング
    
    ser.rank() 優先mothod = ''ファースト)ser.rank 
    ser.rank(昇順= False)が
    
    6相関コアー()及び共分散CoVの()
    
    
    7.NaNデータ 
    7.1 np.NaNのpd.seriesを作成する([1,2,3、np.NaN、 4]、インデックス= [ '''」、.....]) 
    7.2フィルタのNaN ser.dropna()SERの[用SER直接()] frame.dropna()行または列が.notnullを削除NaNにあるだろう
                                                            frame.dropnaを削除(方法=「全て」)すべての要素がNaNであるランク
    7.3 NaNの値フィルである
    (0)frame.fillnaを全てのNaN 0充填
    frame.fillna({0、 'PEN': 'ボール' :. 1、 'マグ' 99})は、異なる列のを異なる値NaNで置き換え
    
    
    8階層インデックスおよび
    8.1度指数:
    MSER PDを= .Series(np.random.rand(8)、インデックス= [ '白'、 '白'、 '白'、 '青'、 '青'、 '赤'、 '赤'、 '赤']、
                                          [ 「アップ」、「ダウン」、 「右」、「アップ」、「ダウン」、「アップ」、「ダウン」、]]) '左' 
    白0.322237アップ
           ダウン0.093246 
           右0.181997
    青アップ0.887448 
           0.032504ダウン
    アップ赤0.612139  
           0.125961ダウンは
           0.030511を残しました
    DTYPE:のfloat64 
    
    プリント(MSER [ '白']) 印刷(MSERの[:、 'アップ'])
      
    DTYPE:のfloat64 
    アップ0.256720 
    0.849860下
    右0.581021 
    のfloat64:DTYPE 
    白0.256720 
    ブルー0.412591 
    赤0.893404 
    DTYPEを:のfloat64 
    
    プリント( '选取特定元素:'、MSER [ '白'、 'アップ'])
    选取特定元素:0.9149258487509073 
    
    
'' ' 
MSER = pd.Series(np.random.rand(8)、インデックス= [ ' ""ホワイト' ' ' ' ' ' ' ' ' ' '] 
                                          [ ' アップ' ' ダウン' ' ' ' アップ' ' ダウン' ' アップ' ' ダウン"]])
 プリント(MSER)
 プリント(MSER [ '  ' ])
 プリント(MSER [:、' アップ' ])
 を印刷' 特定の要素を選択:'、MSER [ ' ホワイト'' アップ' ])
A = MSER .unstack()
 印刷' DFに変換:\ N- ' 、A)は
 '' ' 
DFに変換される:             
ダウン、右任せる
ブルーのNaN NaN 3を0.025439 0.241679 
レッドNaN 3を0.180735 0.225099 0.410451
NaN 3を0.900275 0.536098 0.266825ホワイト
「」「
印刷は、DFシリーズに変換される:\ N- 「a.stack())
 」「」
DFシリーズに変換される:
ブルーダウンを0.241679 
       アップ0.025439 
レッドダウン0.225099は
       0.410451左
       アップ0.180735 
ホワイトダウン0.266825 
       権利を0.536098 
       アップ0.900275 
DTYPE:のfloat64 '' ' は、##レベルの指標ランク定義 
mframe = pd.DataFrame(np.random.randn(16).reshape(4,4 )、
                      インデックス = [ ' ホワイト' '"




' '' ' ]、[ ' アップ''ダウン' ' アップ' ' ダウン' ]、 = [ ' ペン' ' ペン' ' ' ' ' ]、[1,2,1,2 ]])
 プリント(mframe)
 ' '' 
                 ペン紙           
                   1 2 1 2 
アップ1.729195 -0.451135 -0.497403 -0.938851白い
      ダウン-1.267124 0.422545 0.069564 -0.735792 
アップ0.298684 -0.442771 1の赤。301070 0.234371 
      ダウン2.266180 -0.549653 0.108434 -0.394364 
'' ' 

#1 ##、およびオーダー階層の再調整するために 
mframe.columns.names = [ ' オブジェクト' ' ID ' ]    #1 #列名と分類名 
mframe.index.names = [ ステータス ] #1 #ライン名と分類名
プリント(mframe)
 「」 ' 
紙PENオブジェクト           
IDを。1 1 2 2 
色ステータス                                         
ホワイトアップ0.288562 0.516333 0.643500 -0.519511 
       ダウン-0.624583 1.027694 1.759466 -1.194383 
レッドアップ0.425757 1.074917 -1.028554 -0.660548
       0.242714 -0.550235 -0.749478 -0.015347ダウン

「「」
#は、色とトランスデューサ位置状態欄Swaplevelの順序調整
プリント(mframe.swaplevel(ステータス))
 」「」
紙PENオブジェクト           
IDを。1 1 2 2 
ステータスの色を                                        
アップ-0.937241 -1.051002 0.621721 1.227554白
0.951904 0.585412 -0.315780 -0.336806白いダウン
アップ赤-1.824083 0.284429 0.310883 0.031538 
赤いダウン0.851415 0.598169 1.967784 -0.421712 
''」
'

 

おすすめ

転載: www.cnblogs.com/liuhuacai/p/11588243.html