[]データ分析&データマイニング&最もホットな料理統計の毎日の売上高を計算します

1  インポートPANDAS AS PD
 2  インポートnumpyのAS NP
 3。 
4。  は、毎日の売上データのローディングを計算
5。詳細= pd.read_excel(" ./meal_order_detail.xlsx " 6。 プリント" 詳細:\ N- " 、詳細)
 。7  プリント" ディテールの列名:\ N- " 、detail.columns)
 8  
9  1は、各製品の売上高を計算する
10 [:、detail.loc " 有料" ] = detail.loc [:、" カウントを" ] * detail.loc [:、"" ]
 11。 プリント(詳細)
 12は 
13である 2、日データ構造体
14  の時系列データの最初の既定の時間データ変換サポートがパンダ
15 detail.locを[:、" place_order_time " ] = pd.to_datetime(detail.loc [:、" place_order_time " ])
 16  
17。  日付属性リストは、以下の式によって導出される取得
18で detail.loc [:、" " ] = [i.day  I  detail.loc [:、" place_order_time " ]]
 19。 
20  印刷(詳細)
21  
22  3は、売上高の計算は-日付別にグループ化され、統計がSUM支払う
23 RES = detail.groupby(=による" ")[ " 有料" ] .SUM()
 24-  (によってRES = detail.groupbyを= "日")[ "有料 "]#のオブジェクト
25  
26は、 印刷" :\ N- RES "、RES)
1  ホットなストア料理を求めて、コピーの数が販売
2  インポートPANDAS AS PD
 3。 
4つの。 ロードデータ
5。詳細= pd.read_excel(" ./meal_order_detail.xlsx " 6。 プリント" :\ N-詳しく" 、詳細)
 7。 印刷" 詳細に列名:\ N- " 、detail.columns)
 。8  
。9  dishes_nameに第1のカテゴリのタイプ
10 detail.loc [:、" dishes_name " ] = detail.loc [:、" dishes_name " ] .astype(" カテゴリー" 11の 
12  統計分析は、記述
13  印刷" 最もホットな料理との販売コピーの統計分析のために:\ N- "、detail.loc [:、" dishes_name " ] .describe())
 14  
15  米の/皿、ボウルない
16  #がロー米を削除
。17 [:、bool_index = detail.loc " dishes_name " ] == " 米/ボウル" 
18が 印刷" bool_index " 。19  
20  茶碗である行判定する
21= drop_index_list 。detail.loc [bool_index ,:]インデックス
 22は 
23である 。#削除
24(軸= 0、インプレース=、= drop_index_listラベルdetail.drop TRUE)
 25  
26であり、 #は、方法予約
27 [bool_id = detail.loc:、" dishes_name " ] =!" ご飯/ボウル" 
28  
29  #は真に保持さ
30詳細= detail.loc [bool_id ,:]
 31は、 
32の #は、統計的な料理がdeccribe行く
33で 
34ある dishes_nameに最初のカテゴリタイプ
35 detail.loc [:、" dishes_name "] = Detail.loc [:、" dishes_name " ] .astype(" カテゴリ" 36  
37 [  統計分析は、記述
38が 印刷" :\ N-販売、一番ホットな部品料理統計分析のために"、ディテール)

おすすめ

転載: www.cnblogs.com/Tree0108/p/12116079.html