パンダ04_DataFrameライブラリインデックスデータ構造を選択し_

Pd等の輸入パンダ

= {データ
「名前」:[「ドン・ホー」、「王」、「ファラオ」、「趙三」、「ジョン・ドウ」]、
「セックス」:[「男性」、「女性」、「男性」 、 "女"、 "男"]、
"年":[37,22,15,18,33]、
"市":[ "成都"、 "北京"、 "上海"、 "成都"、 "深セン" ]
}

#DataFrameソートsort_values(= "フィールド、すなわちキー"による)
#eg:
#= pd.DataFrame DF1(データ)
#印刷(DF1)
印刷( "_______________________-")
#DF2 = df1.sort_values(=「年によって「)#はちょうど一種のが、インデックスの順序が変更されていない、
#印刷(DF2)
印刷(」_______________________-「)
私たちはライン上の元のインデックス順削除は##
#DF3 = df2.reset_index()#は、インデックスを再構築し、削除しないでくださいオリジナルインデックス
#印刷(DF3)
#DF4 = df2.reset_index(ドロップ= TRUE)#は、元のインデックス削除、インデックスを再構築
(DF4)#プリントを

#データ選択
#Seriesデータ選択とほぼ同様のリストには、彼はより複雑になり、データフレームについては、以下の、言うことはありません。

DF5 = pd.DataFrame(データ)
#プリント(DF5)

#列を選択し、2つの方法があります:[「名前」]またはdf5.name、得ることができ、戻りデータ列シリーズDF5
#印刷(DF5 [「名前」])
印刷(df5.city)
複数選択#をコラム
#印刷(DF5 [[「名前」、「市」]])
なたは、列のセクションを選択することができます#列がスライスを選択するために使用することはできません、スライス行が操作されていますが、データ操作

選択した行番号、LOC、ILOC、などのIX
#印刷(DF5)
#= DF6 df5.set_index( "名前")は、列に#列インデックス]タブになります
。#印刷(DF6)
印刷(df6.loc [「ドン・ホー「])インデックスタブ#1 LOCによって選択する[」インデックスタブがあるようであれば、他方は与えられて「]
プリント(」______________「)
プリント(df6.loc [[」ドンHO「」王「]])選択するためのインデックスタブ複数の#
#の前出、ILOC [1]これは、位置を選択するための指標です。

#アドバンストモードでは、行と列を選択するには、IX
#印刷(DF5)
#DF6 = df5.set_index( "名前")
は、すべてのランクを選択し、IX [行、列] [::、]#DF6 = df5.ix
(#を印刷DF6)
以下を使用するように設定#DF6 = df5.set_index( "名前")、いいえ、あなたは唯一のインデックス番号を使用することができます
。#DF7 = df6.ix [[ "ドンホ"、 "ジョン・ドウ"]、:]
# = df5.ix DF8 [:[ "名前"、 "性別"]
プリント(DF8)
#DF9 = df5.ix [0]
プリント(DF9)

######ブール値は、選択された誤った値に対応する、条件を選択し、ブール第一層を得、関連データ取得する第二層
#プリント(DF5)
#DF5 DF10 = [(DF5 [「市」] == "成都")&(DF5 [ "セックス "] ==" M")]
#= DF5 DF10 [(DF5 [ "市"] == "成都")&(DF5 [ "セックス "] ==" M" )]スクリーニング条件の#に対応する
#1 DF11 = DF5の[(DF5 [ "年"]> 20)&(DF5 [ "セックス"] == " M")&(DF5 [ "都市 "] ==" 成都を" )]#フィルタに複数の基準に相当します
。#印刷(DF11)
)#印刷(df11.sort_values( "年を")


#操作行と列:追加、削除、変更、検索(選択フロントが学んだ)
#印刷(DF5)
「」 "
名前のセックス年度の市
0唐豪男性37成都
1王女性22北京
2ファラオ男性15上海
3趙三人の女性成都18
4 33ジョン・ドウ男性深セン
「」 "
ちょうどバー内部の手術台の上で#

#df5.append(通常はデータ・ワード)で行を追加します
。#NEWDATA = { "名": "赤"、 "セックス": "女性"、 "年":20、 "都市": " 川"}
#DF6 = df5.append(NEWDATA、ignore_index =真 )#は、新たなデータを生成し、元のデータは、一定DF5、変更されていない
元のデータを変更するために##、それはdf5.append DF5(...)=
#印刷(DF6)
を#追加行
#のDF5 [「愛」] = 「 子犬」#は新しいものに存在しない列の名前を割り当てますが、すべてのデータが同じであり、
#印刷(DF5)
#DF5 [「WWWW "] = [" ABC " "DEF"、" abbbb "" XXXXXX "" dfdfsfds「]# はなく、あまりにも多く、ちょうどそんなにエラーしません
#印刷(DF5)

#削除
#DF8 = df5.drop(1)何の変化もないDF5そのまま#元のデータは、ドロップ(位置)行の削除
#印刷(DF8を)
#DF9 = df5.drop( "年"、軸= 1)#AXIS 1 0を見つけるために、x軸、y軸を見つけること。列を削除
#プリント(DF9)

#変更は、値が言及されていない変更、行と列のインデックス修飾および列ラベルの話はここで編集します

Df5.ix DF10 =#[[1,2,4]:]
#プリント(DF10)
#= df10.rename DF11(指数= {列= "シティ": "CITY"} {4 :. 3}、インプレース=偽)#Trueは、元のデータに変更され
#プリント(DF11)
#1 DF11 [ "名前"] [1] = "サバイバルソング"
#プリント(DF11)

おすすめ

転載: www.cnblogs.com/yiyea/p/11441795.html