私たちは、主に特定の属性は、両方のデータ・タイプをパンダ紹介する前の章では、この章の基本的な手段のデータが操作シリーズとデータフレームを説明しています。
再インデックス
オブジェクトパンダの重要な方法はREINDEXあり、その役割は、そのデータが新しいインデックスと一致している、新しいオブジェクトを作成することです:
インポートPd等パンダ OBJ = pd.Series([4.5、7.2、-5.3、3.6]、インデックス= [ ' D '、' B '、' '、' C ' ]) 、印刷(OBJ)
D 4.5 B 7.2 -5.3 C 3.6 DTYPE:のfloat64
これは、シリーズの新しいインデックスのインデックスを再作成するために応じて再配置されます。インデックス値は、現在、欠損値の導入には、存在しない場合は:
OBJ2 = obj.reindex([ ' '、' B '、' C '、' D '、' E ' ]) 、印刷(OBJ2)
-5.3 B 7.2 C 3.6 D 4.5 EのNaN DTYPE:のfloat64
そのような時系列として注文したデータについて、あなたは新しいインデックスからいくつかの補間処理を行う必要があります。メソッドオプションは、この目的を達成するために、例えば、充填値で充填する前に達成することができます。
OBJ3 = pd.Series([ ' 青'、' 紫'、' 黄色' ]、インデックス= [0、2、4 ]) 、印刷(OBJ3)
0青 2紫 4イエロー DTYPE:オブジェクト
プリント(obj3.reindex(範囲(6)、メソッド= ' ffill '))
0ブルー 1青 2紫 3紫 4黄色 5黄色 DTYPE:オブジェクト
データフレームと、REINDEXは(行)インデックスと列を変更することができます。唯一の合格シーケンスは、ラインがします再インデックスの結果:
フレーム= pd.DataFrame(np.arange(9).reshape(3,3)、インデックス= [ ' '、' C '、' D ' ]、列= [ ' オハイオ'、' テキサス'、' カリフォルニア' ]) 、印刷(フレーム)
オハイオ州、テキサスカリフォルニア州 0 1 2 3 4 5 C D 6 7 8
フレーム2 = frame.reindex([ ' '、' B '、' C '、' D ' ]) プリント(フレーム2)
オハイオ、テキサス、カリフォルニア の0.0 1.0 2.0 ガルフショアーズB 3.0 4.0 5.0 C D 6.0 7.0 8.0
インデックス列には、キーワードを再使用する列を指定できます。
状態= [ ' テキサス'、' ユタ'、' カリフォルニア' ] プリント(frame.reindex(列=州))
テキサスユタカリフォルニア 1 2の 5のC 4 7 8の
継続的に更新さ......