Pythonのデータ解析処理(B) - 正規化した正規化されたデータを処理(変換領域)の数学的モデル(CUMCM 2011)(同じ名前のランクに対応する計算された2つのテーブルが)の一例です

具体的なデータは、ブログ、下のリンクから入手でき、データの処理の標準化、データおよび以前の作業を継続     

外れ値を除きます

 

スクリーンショットは、ExcelのテーブルとIIを置きます

  

 

一般的な考え方:
実用上の問題は、異なるデータをファジークラスタリングとして、標準化される必要があり、異なる寸法と性質を持っていることがあります。レンジ変換は、本明細書中で使用しました:

 

コードを入れてください:

AS NP numpyのインポート
インポートPANDAS PD ASの
パス= "E:/ Model_building / A /"
S2 = pd.read_excel(パス+ "sheet2.xlsx")
S1 = pd.read_excel(パス+ "sheet1.xlsx")1,2#インポート表
S1 = pd.DataFrame(s1.values)データフレーム#
S2 = pd.DataFrame(s2.values)
S1 = s1.drop([s1.columns [0]、軸= 1)は#0除去
S2 = S2。ドロップ([s2.columns [0]、軸= 1)
 
s1.columns = [ ''、 'B'、 'C'、 'D'、 'E']#削除前に死亡列名を求め、依然としてカラム名を使用することがより便利に感じる
[ '1' 、 '2'、' 3' 、 '4' 、' 5' 、 '6' 、' 7' 、 '8' 、' 9' ] = s2.columnsを
 
S2 [ '1'] = S2 [ ' 1']。astype( 'Int64の')#の出力数は変更INT、floatとして表2に見出される
、1ポイントをサンプリングされた出力S1とS2、見てヘッド数、B、C XY座標、dは仰角で、Eは、領域の種類である2-9各サンプリング点における8つの要素の濃度に

S12 = pd.merge(S1、S2、どのよう= 'インナー'、left_on = ''、right_on = '1')# 1及び2テーブルインデックスに応じて、マージS12
デルS12 [」1' ]
s12.head ()
ヘッドの出力S12を見て、あなたが理解していること

=パス"E:/ Model_building / A /"
ミリアンペア= s12.groupby(S12 [ 'E'])MAX()ILOC。[:、4:12]。
miザs12.groupby =(S12 [ 'E']) .min()ILOC。[:、4:12 ]#1 列のパケット領域、得られた各要素の最大値と最小値
S122 = s12.set_index([ '' 、 'E'])# ダブルインデックス   
プリント(MI、 '\ N-')
プリント(s122.head())
s122.iloc [:、3:12] =(s122.iloc [:、3:12] - miザ)/(MA-miザ)#レンジ変換
S122。 to_excel(パス+「sheet_standardized.xlsx」)は
MI S122及び減算によって、ときに、範囲の変換が行われる次のように、各E複数S122ので、それは、与えられました:

 

 

インデックスが重複することができない、それがそうするとき、減算、自動マッチング対応する行(e)および列(要素)は、二重指数(すなわち、シーケンス番号と領域)が設けられています

pathx = "E:/ Model_building / A / cumcm2011A データアネックス_ * .XLS"
各領域#の各要素の.. GROUPBY(S12 [ 'E'])、平均()P = s12.iloc [:5]平均
印刷(P)
S122 = s122.reset_index()#インデックスを取り消し、次のステップ'E'を参照
P1 = s122.groupby(S122 [ 'E'])、平均()ILOC [:5:] ..#あたり地域の各要素、レンジ変換によって平均
印刷(P1)
の保存p1.to_excel(パス+「sheet1-6.xlsx」)#
p.to_excel(パス+「sheet1-7.xlsx」)は、
二つのテーブルについて置きます結果

 

 

公開された117元の記事 ウォン称賛41 ビュー60000 +

おすすめ

転載: blog.csdn.net/pangzhaowen/article/details/103941940