母子製品の売上分析(PythonソースコードとTableauファイルを使用)
このプロジェクトのソースリンク:Baiduクラウドディスク抽出コード6zdz
データソース:Ali Tianchi
スペースを削減するために、この記事はソースコードにできるだけ一致せず、ファイルに詳細なコメントが含まれています。
このケースでは、PythonとTableauを組み合わせています。データとディメンションが少量であるため、Tableauは視覚化に使用されます。
プロジェクト紹介
プロジェクトの背景
PESTフレームワークによると、4つの視点からの簡単な分析:
- 政策政治:国家開発改革委員会は2013年5月28日に、13の部門が、信頼できる取引、モバイル決済、オンライン電子請求書、商業流通、物流流通を含む5つの側面でeコマース開発をサポートする一連の政策措置を導入すると発表しました。これは、オンラインの母子商品市場の急速な発展を促進するのに役立ちます。
- 経済:国内経済の着実な成長に伴い、中国の都市住民の可処分所得は2015年に31,195元に増加し、農村住民の可処分所得は同じ期間に11,422元に増加しました。一人当たり可処分所得が増えると、家計の消費意欲が高まり、2015年には、中国の母子産業の市場規模は2兆に達すると予測されています。
- 社会:第一級の都市居住者にとって、携帯電話、コンピューター、およびその他の電子ネットワークデバイスを通じていつでもどこでも買い物を完了することができる新しい消費方法は、コンパクトなライフリズムによりよく適応できます。宅配便の利便性は、オンラインショッピングをより魅力的なものにします。
- テクノロジー:4Gネットワークの人気、携帯電話やiPadなどのモバイルデバイスの急速なアップグレードと反復、およびオンライン決済システムの開発は、eコマースの急速な台頭に大きな推進力をもたらしました。
分析目的
- オンラインマーチャントがさまざまな時間ノードとシナリオに応じてさまざまな販売および運用管理戦略を立てるのを助け、マーチャントが売り上げと売上を増やし、運用コストを削減するのを助けます。
- 子供の情報(年齢、性別など)に応じて、ユーザーが購入する製品の種類を予測します。(未完成)
問題解決
データの概要
Ali_Mum_Babyは、消費者から提供された900万以上の子供の情報(誕生日と性別)を含むデータセットで、より良い推奨や検索結果を得るためにこの情報を共有します。
このデータには2つのcsvがあります。
赤ちゃん情報フォーム
カラム | 説明文 |
---|---|
ユーザーID | ユーザーID |
お誕生日 | 子供の誕生日 |
性別 | 0-女性、1-男性、2-不明 |
取引記録フォーム
カラム | 説明文 |
---|---|
item_id | アイテムID |
ユーザーID | ユーザーID |
cat_id | カテゴリーID |
cat1 | ルートカテゴリID |
性質 | 対応するアイテムのプロパティ |
buy_mount | 購入数量 |
日 | タイムスタンプ |
データの準備
データをインポートする
baby = pd.read_csv("./sam_tianchi_mum_baby.csv")
trade =pd.read_csv("./sam_tianchi_mum_baby_trade_history.csv")
概要データ
- ベビーテーブルには3次元しかなく、合計953行のデータがあり、欠損値はありません。
- 取引テーブルには7つのディメンションがあり、欠損値のない合計29,971行のデータがあります。
- trade.propertyは商品プロパティです。すべて数値文字列であるため、最初に削除します。
トレードテーブルのbuy_mountは、私たちが懸念している重要なラベルです。記述統計と画像から、このデータの平均値は2.5、標準偏差は64、異常値があるため、平均から3標準偏差以内にデータを保存します。 [0,195]。
データのクリーニング
- 欠損値の外れ値をチェックして対処します。
- trade_idでトレードに指定されていない属性は、デフォルトでitem_idに変更します。
- データセットのプロパティはすべて数値です。対応するプロパティが何であるかを知るには、対応する辞書が必要であり、まずそれを削除します。
- 日付を日付形式に変更します。
# 根据info()查看,本数据集无缺失值
# 列重命名
trade.rename({"auction_id":"item_id"},axis=1,inplace=True)
# 先将property暂且取出放在一边,后续再分析
property = trade.property
trade.drop('property',axis=1,inplace=True)
# 日期类型转换
baby['birthday']=pd.to_datetime(baby.birthday.astype('str'))
trade['day'] = pd.to_datetime(trade.day.astype('str'))
クリーニング後、データは29,942行に残ります。統計時間は2012/7 / 2-2015 / 2/5です。データセット全体には、6つの製品カテゴリ、662の製品カテゴリ、28394の製品、および29915のユーザーがあります。
これは2年以上切り捨てられたデータであり、一部のデータが不足しているため、このデータセットに基づいてのみ分析できます。主なアイデア。
データ分析
全体的な市場状況
2017年7月から2015年2月までの総販売数量は49,973件でした。上の図から、淘宝網と小モールのプラットフォームにおける母子製品市場全体の販売数量は増加傾向にあるが、変動は比較的大きいことがわかります。
- 2015年のデータがないため、2015年の第1四半期の実際の売上を反映できません
- 毎年第1四半期の売上高は、一定の減少を示します。毎年第4四半期の売上は大幅に増加します。
- 2013年と2014年の第1四半期の売上高は、主に1月と2月に減少しました。
- 毎年5月と11月には、さまざまなレベルの売上成長が見られます。
第1四半期の売上減少の理由
第1四半期の減少の理由は、春節に関係していると想定します。
- 2013/2 / 1-2013 / 2/15は売上の一番下、2013春祭りの休日:2013/2 / 9-2013 / 2/15
- 2014/1 / 26-2014 / 2/4は売上の一番下、2014春祭りの休日:2014/1 / 31-2014 / 2/6
2015年の春祭りの休日は2015/2 / 18-2015 / 2/24で、データセットの統計時間は2015/2/5までなので、2015年の第1四半期の状況は分析しません。
春節の時期が近づくと、一部の企業は休暇が早く、速達が停止し、販売期間は基本的に春節の休日と一致します。休暇終了後は、購入数とユーザー数が増加するため、第1四半期の売上高の減少は、春節の休日が原因と考えられます。
第4四半期の売上増加の理由
この仮定は、ダブルイレブンダブルダブル12アクティビティに関連しています。
- 2013年と2014年の販売数量と販売数量が2倍の11と12倍に急増したことがはっきりとわかります。
- 毎年、ダブルイレブンイベントのユーザー数と販売量は前年よりも多く、ユーザー数は75%〜80%増加しました。
したがって、毎年第4四半期の売上高の増加は、ダブルイレブンダブル12イベントと大きな関係があると考えられます。
買い戻し率
毎月の商品の買い戻し率は非常に低いです。各主要カテゴリーの買い戻し率も非常に低く、いずれも1%を超えていません。そのうち38の主要カテゴリーの買い戻し率は0.17%と最も高くなっています。ユーザーの1回の購入量はほとんど1つであり、再購入率が低いことを考えると、1つの製品を再購入したいというユーザーの欲求は非常に低く、販売者は製品の品質やショッピング体験などの製品の観点からそれを考慮する必要があります。
商品販売
カテゴリー28と50008168が最も売上が高く、カテゴリー38は販売量が少なく、サブカテゴリーの数は最も少ないですが、一人当たりの購入量は非常に多いです。製品の需要は非常に強く、大カテゴリー38のサブカテゴリー製品を適切な量だけ増やして、販売量を増やすことができます。
12265008製品の売上高と一人当たりの需要は高くありません。これは、これらの製品に対するユーザーの需要が低いことを示しています。在庫のバックログを回避するために、購入を減らすことをお勧めします。
赤ちゃんの状況
内側の2つのテーブルを接続すると、1984年に明らかに異常値である赤ん坊がいることがわかりました。これを排除したいと考えています。
データは2015/2で計算されているため、分析日は2015/3であると想定し、母子製品を購入するユーザーのうち、赤ちゃんの年齢は主に0〜3歳に集中しています。
母子製品を購入するユーザー世帯の47.1%は男性の乳児で、52.9%は女性の乳児です。
乳児の年齢を、胎児、乳幼児(0〜12か月)、幼児(1〜3歳)、就学前(3〜7歳)、学齢(7歳)に分けました。
上記の写真によると、さまざまな段階で人気のある赤ちゃんのカテゴリを簡単に確認できます。
- 胎児:50014815、50022520、5008168、28
- 乳児期:50014815、50022520、5008168、28
- 幼児期:50014815、50008168、28
- 未就学年齢:50008168、28
- 学齢:50008168
乳幼児の年齢が上がるにつれて、50008168カテゴリの製品の需要は徐々に増加し、50014815カテゴリの製品の需要は徐々に減少します。
女の赤ちゃんの世帯の商品に対する需要は明らかに男性の世帯のそれよりも大きいので、商品のカテゴリーを見てみましょう。
主要カテゴリ50014815の50018831商品の販売記録の71.05%が女の赤ちゃんの家族によって購入されたことがわかります。購入実績では、一部の高売れ商品の家族購入が100%の場合も少なくありません。
まとめ
製品販売
- 母子製品の売上は年々増加していますが、月々の変動は比較的大きくなっています。
- 毎年春節の影響を受け、第1四半期の売上高は年間を通じて最低となり、ダブル11とダブル12のイベントの促進により、第4四半期の売上高は年間ピークに達します。
- ユーザーの再購入率は非常に低く、製品の品質、価格、購入体験を考慮して改善する必要があります。
- 50014815、50008168、28がトップセラーのTOP3です
- カテゴリ38は販売量は少ないですが、1人あたりのユーザーの購入数が非常に多いため、このカテゴリの下にサブカテゴリを追加して、ユーザーの選択肢を増やし、売上を増やすことを検討できます。
ユーザーのポートレート
- 幼児期(1〜3歳)の利用者の需要が最も多く、乳幼児の年齢が上がるにつれ、母体・乳幼児向けの商品の需要は徐々に減っていきます。
- 男性と女性の乳幼児世帯の割合は近いですが、女性の乳幼児世帯の購入量は男性の乳幼児世帯の購入量よりも大幅に多いです。
- いくつかの商品を購入する女性の赤ちゃんの割合は、男性の赤ちゃんのそれよりもかなり大きいです。このカテゴリの商品は、さらに女児に変更して、より多くの女児の家族に購入を促すことができます。
提案する
- 春節の1週間前に、製品プロモーションへの投資を減らし、購入量を減らし、低レベルの在庫を維持する必要があります。11倍と12倍のウォームアップフェーズを強化して、業務活動を促進し、充実させ、より多くの乗客を呼び込む必要があります。同時に、商品の安定的な供給を確保するためには、商品の在庫を増やす必要があります。カスタマーサービス担当者を増やし、ロジスティクスにタイムリーに連絡して、ユーザーのクエリにタイムリーに回答し、配送効率を向上させ、ユーザーの購入体験を向上させる必要があります。
- 商品の買い戻し率が低い。購入したユーザーへの再訪問を強化し、買い戻しの理由を分析し、これらの要素を改善する必要があります。
- 男子よりも女児の購入数が多いため、男児専用の商品を増やし、男児の購入数を増やすことをお勧めします。
- 各主要カテゴリ、特に主要カテゴリ38の下のサブカテゴリ製品を拡大するには、ユーザーの選択肢を増やし、サブカテゴリ製品の売上を増やしてから、主要カテゴリの売上を増やします。
- 在庫バックログを回避するために、12265008カテゴリの製品の購入を減らします。
参考文献
参考までに個人的な意見