データ分析の概要の一般的に使用される方法

病院の販売データ解析ケースキー知識ポイント

読みます

データ= pd.read_excel( 'chao.xlsx'、DTYPE = 'オブジェクト')

データ型を防ぐために、オブジェクトのタイプは、最初の統一で導入しました

列名へ戻ります

dataDF.rename(列= { "時間の消費者":"販売期間"}、インプレース= 真)

データ型変換

dataDF [ "販売"] = dataDF [ "販売"] .astype("F8")

 

ここでのF8キーのfloat64の意味であります

タイムフォーマット文字列のターン、強力なターンエラー

dataDF.loc [:、"販売期間"] = pd.to_datetime(dataDF.loc [:、"販売期間"]、エラー= '強制')

時間に基づいて日数

daysI =(endTimeは - のstartTime).days

ビジネスインデックス

月平均消費=合計回数ヶ月の消費/数

消費の月平均額=ヶ月の総消費量/数

カスタマー価格=総消費量の消費量/数の合計金額

消費者動向

一般的な描画プロパティ設定

 

 

描画を防ぐ中国のエラー

  1. pylabから輸入MPL
     mpl.rcParams [ 'font.sans-セリフ'] = [ 'SimHei']
     

おすすめ

転載: www.cnblogs.com/mypath/p/12170282.html