2022年度全国大学生データ分析コンテスト 医薬品EC販売データの完全問題解決チュートリアルとコード分析

トピックA:問題を解決するための医薬品の電子商取引の販売データの完全な分析
国家政策の段階的な開放により、ますます多くの医薬品がオンラインで購入できるようになり、医薬品の電子商取引プラットフォームは活況を呈しており、新しいクラウンの流行の影響を受け、また、医薬品の電子商取引がより多くの消費者の視野に入ることを可能にし、主要な製薬会社も医薬品の電子商取引を展開する取り組みを強化しています。しかし、e コマース モデルはオフラインの小売とは異なり、医薬品の e コマースをより適切に管理する方法は、製薬会社が解決しなければならない緊急の課題となっています。この質問は Tmall のビタミン薬を収集します.ビタミン薬に関するデータをクリーニング、分析、マイニングし、次の質問に答えてください.

2.1 最初の質問

店舗を分析すると、合計で何店舗含まれているか、各店舗の売上比率はどれくらいか。売上の割合が最も高い店舗を与え、その店舗の売上を分析します。

トピック分析: shop_name フィールドの重複排除値と店舗数を計算し、売上を計算し、店舗ごとにグループ化し、各店舗の売上比率を計算します。次に、売上高比率が最も高い店舗を取得するために降順に並べ替え、売上高が最も高い店舗の他のフィールドでデータの要約分析を実行します

2.2. 2 番目の質問

すべての薬を分析し、合計でいくつの薬が含まれているか、各薬の売上比率はどれくらいか? 売上比率が最も高い 10 種類の医薬品を与え、これら 10 種類の医薬品の月間売上曲線を描きます。

トピック分析:id欄の重複排除値と薬品数の統計(タイトルは解析不可。タイトルは同じ商品もあるが、味などの情報が異なるため、idを解析した方が良いのではないかと思う) )、計算 販売数量を薬品ごとにグループ分けし、各薬品の売上比率を計算します。次に、降順にソートし、売上比率が最も高い 10 の医薬品を数え、これら 10 の医薬品の月間売上曲線を描きます。

2.3. 3 番目の質問

すべての医薬品ブランドを分析し、合計でいくつのブランドが含まれ、各ブランドの売上比率は? 売上比率の高い10ブランドを挙げて、その10ブランドの売れ行きが良い理由を分析してみては?

トピック分析:ブランドフィールドのブランドの重複排除値と数を計算し、売上を計算し、ブランドごとにグループ化し、各ブランドの売上比率を計算します。次に、降順にソートし、売上比率が最も高い 10 個の薬を数えます。対応する価格と割引のチャートから、より良い販売の理由を分析できます。

2.3. 4 番目の質問

今後 3 か月間の Tmall のビタミン剤の総売上を予測し、近似曲線を描いてモデルのパフォーマンスとエラーを評価します。

トピック分析: まず、Tmall ストアでビタミンの対応する製品を選択し、時間に従ってそれらをグループ化し、時系列データを取得してから、時系列予測を行います。従来のアリマ モデルまたはグレー予測モデルを使用できます。ディープ ラーニングを使用した機械学習 xgboost、ニューラル ネットワーク、または lstm モデルを使用します。これは適切であるため、mape を使用してモデルのパフォーマンスを評価できます。

2.3. 5 番目の質問

製薬会社が新しいビタミン ブランドをオンラインで販売することを計画しており、2 ページ以内の e コマース ビジネス戦略を設計するコンサルタントとしてあなたを雇いました。

トピック分析: これは、上記の 3 番目の質問のデータに基づいて分析できます。

完全な問題解決プロセスのビデオがリリースされました。

2022 全国大学生データ分析コンペティション A 問ナニーレベルのチュートリアルと完全な問題解決コード_哔哩哔哩_bilibili

Supongo que te gusta

Origin blog.csdn.net/weixin_44099072/article/details/128499478
Recomendado
Clasificación