インポートPANDAS AS PD インポートNP AS numpyの 「」 ' DF作成。 1.定義DF:辞書送信 【:配列キー各キーの値としてキー配列を有する各列1.1の名前を 1.2ネスト辞書生成DFをクラスキー列名名などの要素の二列の重要な要素として 1.3 pd.DataFrame DF(辞書、列は= [「KEY1」、「KEY2」])作成] 1.4 DF指定されたラベルを(インデックス)pd.DataFrame (辞書、列は= [ 'KEY1'、 'KEY2']、インデックス= [ 'つ'、 'TWO'、 `` `]) 2.定義DF:インデックスデータ行列+カラム+ 2.1直接値タグに列名pd.DataFrame(np.arange(16).reshape( 4,4)、インデックス= [ '1'、 '2'、...]、列= [ 'オブジェクト'、 ''、..] ) II。エレメントを選択 値1 1.1 [カラム名タグ値frame.columnsのframe.valuesを参照] frame.index [[ 'フレームを取る1.2物体1' 、 'オブジェクト2'] frame.object 1.3取行フレーム[1:3] 1.4つの値のフレーム[ 'オブジェクト'] [2かかり -----] DF ----シリーズインデックス値 2.割り当て NAME = 'ID' frame.columns.name、ランクタグ名frame.index 2.1 = 「項目」 2.2フレーム[「新」] = 12翻訳フレームを追加[「新しい新しい」] = [12,12,12,12] 2.3フレームを変更[「新しい新しい」] =シリーズ 2.4単一値DFを修正-カラムシリーズ-指標枠[ '新しい新規'] [2] = 3 3. DFの要素かどうかを判定する 3.1 frame.isinのDF =(1.0、 'PEN']) 4.削除カラム 4.1デルフレーム【 '新しいです' ] 5.フィルタ 5.1すべてのフィルタフレーム[フレーム<12である] 列フレームの5.2スクリーニング[frame.new <12]は 6転置 frame.T オブジェクト.INDEX 3 1.重複インデックスserd.index.is_uniqueフレームかどうかを決定します。index.is_unique 重複インデックスSERD 2. [「重複インデックスを」]シリーズフレーム[「重複インデックス」]バックフレームを返します。 3.Series.reindex([索引配列]、方法= 'ffill') frame.reindex([ ランキング配列]、メソッド= 'ffill'、列= [ ''、 ''、....]) 4.削除ドロップ()リターン[新しいオブジェクトの削除されたインデックスと要素を除く] ser.drop([「」、「」 ]) 複数のインデックスを削除し、アレイ入力が使用 行を削除:Frame.drop([「」、「 」 、「」]) 列を削除:Frame.drop([「」、「」、「」] = 1軸) 5データ要素クラスとその動作(プラス) 4.1オブジェクトは、対応する、ラベルの2つのシリーズを持っていますデータオブジェクトが一部のみ充填率NaNに添加される、請求 4.2二つのオブジェクトフレームのフレームはNaNを添加することによって、インデックス要素およびその逆に対応する2つの列が満たされた データ構造との間の四則 1マス(要素レベル) :[]満足ブロードキャスト機構 a.add(B) サブ() DIV() MUL() 。[マッピング関数アプリケーションと5つのライブラリ] 1機能素子の動作(一般機能) ##当たりnp.sqrt(フレーム)平方根要素 - X。分() frame.apply(F)は、行を計算している### 関数演算2.ランク ラムダX = F:x.max() - x.min() frame.apply(F、軸= 1)###列演算により 戻り値の2.1複数 DEF F(X): 戻りpd.Series([X .MAX()、x.min()]、インデックス= [ '分'、 '最大']) frame.apply(F) 3.統計関数 frame.sum() frame.mean() frame.describe() 4.ソート 4.1 ser.sort_index() 4.2 ser.sort_index(軸= 1) 4.3 frame.sort_index() 4.4 frame.sort_index(軸= 1) (=による[ 'columns1'、 'columns2'])4.4 frame.sort_index 予選回ランキング ser.rank() (優先mothod = ''ファースト)ser.rank ser.rank(昇順= False)が 6相関コアー()及び共分散CoVの() 7.NaNデータ 7.1 np.NaNのpd.seriesを作成する([1,2,3、np.NaN、 4]、インデックス= [ '''」、.....]) 7.2フィルタのNaN ser.dropna()SERの[用SER直接()] frame.dropna()行または列が.notnullを削除NaNにあるだろう frame.dropnaを削除(方法=「全て」)すべての要素がNaNであるランク 7.3 NaNの値フィルである (0)frame.fillnaを全てのNaN 0充填 frame.fillna({0、 'PEN': 'ボール' :. 1、 'マグ' 99})は、異なる列のを異なる値NaNで置き換え 8階層インデックスおよび 8.1度指数: MSER PDを= .Series(np.random.rand(8)、インデックス= [ '白'、 '白'、 '白'、 '青'、 '青'、 '赤'、 '赤'、 '赤']、 [ 「アップ」、「ダウン」、 「右」、「アップ」、「ダウン」、「アップ」、「ダウン」、]]) '左' 白0.322237アップ ダウン0.093246 右0.181997 青アップ0.887448 0.032504ダウン アップ赤0.612139 0.125961ダウンは 0.030511を残しました DTYPE:のfloat64 プリント(MSER [ '白']) 、印刷(MSERの[:、 'アップ']) DTYPE:のfloat64 アップ0.256720 0.849860下 右0.581021 のfloat64:DTYPE 白0.256720 ブルー0.412591 赤0.893404 DTYPEを:のfloat64 プリント( '选取特定元素:'、MSER [ '白'、 'アップ']) 选取特定元素:0.9149258487509073 '' ' MSER = pd.Series(np.random.rand(8)、インデックス= [ ' 白「」白"、"ホワイト' ' 青' ' 青' ' 赤' ' 赤' ' 赤'] [ ' アップ' ' ダウン' ' 右' ' アップ' ' ダウン' ' アップ' ' ダウン「」左"]]) プリント(MSER) プリント(MSER [ ' 白 ' ]) プリント(MSER [:、' アップ' ]) を印刷(' 特定の要素を選択:'、MSER [ ' ホワイト'、' アップ' ]) A = MSER .unstack() 印刷(' DFに変換:\ N- ' 、A)は '' ' DFに変換される: ダウン、右任せる ブルーのNaN NaN 3を0.025439 0.241679 レッドNaN 3を0.180735 0.225099 0.410451 NaN 3を0.900275 0.536098 0.266825ホワイト 「」「 印刷は、(」DFシリーズに変換される:\ N- 「a.stack()) 」「」 DFシリーズに変換される: ブルーダウンを0.241679 アップ0.025439 レッドダウン0.225099は 0.410451左 アップ0.180735 ホワイトダウン0.266825 権利を0.536098 アップ0.900275 DTYPE:のfloat64 '' ' #は、##レベルの指標ランク定義 mframe = pd.DataFrame(np.random.randn(16).reshape(4,4 )、 インデックス = [ ' ホワイト' '白" 、' 赤'、' 赤' ]、[ ' アップ'、'ダウン' ' アップ' ' ダウン' ]、 列 = [ ' ペン' ' ペン' ' 紙' ' 紙' ]、[1,2,1,2 ]]) プリント(mframe) ' '' ペン紙 1 2 1 2 アップ1.729195 -0.451135 -0.497403 -0.938851白い ダウン-1.267124 0.422545 0.069564 -0.735792 アップ0.298684 -0.442771 1の赤。301070 0.234371 ダウン2.266180 -0.549653 0.108434 -0.394364 '' ' #1 ##、およびオーダー階層の再調整するために mframe.columns.names = [ ' オブジェクト' ' ID ' ] #1 #列名と分類名 mframe.index.names = [ 「色」、「ステータス」 ] #1 #ライン名と分類名 プリント(mframe) 「」 ' 紙PENオブジェクト IDを。1 1 2 2 色ステータス ホワイトアップ0.288562 0.516333 0.643500 -0.519511 ダウン-0.624583 1.027694 1.759466 -1.194383 レッドアップ0.425757 1.074917 -1.028554 -0.660548 0.242714 -0.550235 -0.749478 -0.015347ダウン 「「」 ##は、色とトランスデューサ位置状態欄Swaplevelの順序調整 プリント(mframe.swaplevel(」色「」ステータス「)) 」「」 紙PENオブジェクト IDを。1 1 2 2 ステータスの色を アップ-0.937241 -1.051002 0.621721 1.227554白 0.951904 0.585412 -0.315780 -0.336806白いダウン アップ赤-1.824083 0.284429 0.310883 0.031538 赤いダウン0.851415 0.598169 1.967784 -0.421712 ''」 '