Pythonのデータ解析および処理() - 例として国立数理モデル(CUMCM 2011タイトル)における拒絶反応に対処するために

コードは、必ずしも初心者データ処理、改善のための歓迎の提案の神に適した最適な構造ではないので、いくつかのデバッグを体験するため

 

出典:

http://www.mcm.edu.cn

 

 

pは平均値とする、sは標準偏差であります

表III、バックグラウンド値[PS、P + S]ので、テーブルは、アプリケーションから見た、データの間引きを満たしていません

コード

AS NP numpyのインポート
インポートPANDAS PD ASの
パス= "E:/ Model_building / A / cumcm2011Aアネックス_データ* .XLS"
S1 = pd.read_excel(パス、SHEET_NAME = "付録1")
S2 = pd.read_excel(パス、SHEET_NAME = "付属書2")
S3 = pd.read_excel(パス、SHEET_NAME = "附属書3")#は、3つのテーブルのファイルを読み込み、
S1 = s1.values#数値に変換
S2 = s2.values
S3 = s3.values
S1 = pd.DataFrame(S1)#のデータフレームは、形式に変換
S2 = pd.DataFrame(S2)
S3 = pd.DataFrame(S3)
プリント(S1)
S1 = s1.iloc [0 2:、:5]
S2 = S2。 ILOC [0 2:、:9]
S3 = s3.iloc [2:、:]#は、テーブルトップの不要な部分を除去し、右のようなテーブル
プリント(S1、 '\ N-')
プリント(S2、「\ N- ')
' \ N-)(S3、印刷'
] [= Lが
C(1,9)の範囲のために:#リストに各要素の標準偏差
    s2.iloc = A [:C] .std()
    l.append(A)
    (A、 '\ N-')プリント
 
P = []を
C(1,9)の範囲の場合:要素の平均リスト#に
    s2.iloc = A [:C] .mean()
    p.append(A)
    
 
の範囲内のC(0,8)用:         
    themin = P [C] - L * 2 [C]
    themax P = [C] + L * 2 [C]
    印刷(themin、 ''、themax)
    S2 = S2 [(s2.iloc [C:、+ 1]> = themin。)&(s2.iloc [C:。、+ 1 <= themax) 】選択された行の一致#
    プリント(S2)、
    印刷(s2.shape [0]、 '\ N-を'、 '\ N-')
ID = pd.DataFrame(s2.iloc [:0])表20#別のテーブルに
プリント(ID)
S1 = pd.merge(S1、ID、どのよう= "内側"、right_on = 0、left_on = 0)#テーブル10は、テーブル20の行を見つけるために、マージ、ジョイン、 constackスプライシング
印刷(S1)
パス=「E:/ Model_building / A /」#保存
s1.to_excel(パス+ "sheet1.xlsx")
s2.to_excel(パス+ "sheet2.xlsx")
s3.to_excel(パス+ "sheet3.xlsx")
 
 

公開された117元の記事 ウォン称賛41 ビュー60000 +

おすすめ

転載: blog.csdn.net/pangzhaowen/article/details/103941928