データ分析 - 5 つの一般的な方法の例

1.比較

    俗に言う比較ですが、一つのデータだけを見ても何かを感じることはできず、別のデータと比較しなければ感じられません。たとえば、下の写真aと写真bです。

写真aには感情がない

図bと昨日の取引高を比較すると、今日と昨日には大きな違いがあることがわかります。

これが最も基本的な考え方であり、最も重要な考え方です。実際には、製品の選択増分監視など、幅広い用途に使用されます。これらのプロセスは「比較」を行っています。意思決定を行う上司がデータを取得した後、データが独立していて比較できない場合、意思決定を行う上司は、データを比較することになります。判断できないことは、「データから有用な情報を読み取ることができない」に相当します。

2.分割_

   「分析」という言葉は、文字通りに理解すると、分割することと分析することを意味します。分割することは分析を意味するのではありません。分析には分割も含まれます。分割することは、理由を見つけるのに役立ちます(これは単に究極の意味です

最初の「比較」の考えに戻りますが、ある次元で比較できる場合、私たちは比較することを選択します。比較した結果問題が発生し、原因を究明する必要がある場合、または比較がまったく行われていない場合。この時は分割されていました。

例えば:

「子供靴○○」の運営グループが取引データを比較したところ、今日の売上は昨日の50%にすぎず、現時点では売上数量をどう比較しても意味がありません。このとき、売上ディメンションを分解して指標を分割する必要があります。

売上高 = 取引ユーザー数 * 顧客あたりの単価、取引ユーザー数は訪問者数 * コンバージョン率に等しくなります。

図 c と図 d に示すように:

図cは、インジケーターの式を分解したものです。

図 b は、トラフィックの構成要素を単純に分解したものです (非常に細かく完全に分割することもできます)

分割後の結果は分割前よりもはるかに明確になり、分析や詳細の検索が容易になります。分割はアナリストにとって必要な思考の 1 つであることがわかります。

3.次元削減

    大量のディメンション データを前にして何もできないとき、データのディメンションが多すぎるとき、すべてのディメンションを分析することは不可能です。代表的なディメンションをフィルタリングできる関連指標がいくつかあります。 。次の表に示すように:

非常に多くの次元があるため、それぞれを分析する必要はありません。取引ユーザー数/対象顧客数= コンバージョン率であることがわかっており、このディメンションが存在し、他の 2 つのディメンションによる計算でコンバージョンできる場合、ディメンションを減らすことができます。

取引を行ったユーザー数、訪問者数、コンバージョン率の 3 つから 2 つを選択するだけです。また、取引ユーザー数×単価=販売数量、この3つから2つを選ぶこともできます。

通常、私たちは自分にとって役立つデータのみを気にしますが、分析に無関係なデータの特定の次元が存在する場合は、それらをフィルタリングして次元を削減できます。

4.寸法増加

次元の増加と次元の減少は対応しており、減少があれば増加もあるはずです現在のディメンションでは問題をうまく説明できない場合は、データに対して操作を実行し、インジケーターを 1 つ追加する必要があります。下の写真をご覧ください。

検索インデックスとカテゴリ数が見つかりました。この 2 つの指標は需要を表し、もう 1 つは競合を表します。多くの人は検索インデックス /カテゴリ数= 倍数を使用して、単語の競合度を倍数で表します。このアプローチにより、次元が追加されます。追加された次元は補助列と呼ばれます

次元の増加と次元の削減には、データの意味を完全に理解し、分析を容易にするためにデータに対する意図的な変換操作が必要です。

5.仮説_

将来について確信が持てない   とき、または混乱しているとき仮説を適用することができます 仮説とは統計学の専門用語であり、一般に仮説として知られています。結果が分からない場合や選択肢が複数ある場合は仮説を立て、結果があると仮定して逆の発想をします。

結果から原因へ、どういう原因があってこの結果が生まれるのか。ちょっとしたルーツ探しです。(たとえば、ガールフレンドと関係を持つという最終目標を分析します。)すると、現在満たされている原因の数と、さらに必要な原因がいくつあるかを知ることができます。複数選択の状況の場合、この方法を使用して最適なパスの決定 (対処方法) を見つけることができます。

もちろん、仮説の力はそれを超えています。仮説は馬のようなものです (空虚に歩く) 結果だけでなく、プロセスも仮説化できます。

データ分析の目的に立ち返ると、問題とニーズを明確にして初めて分析手法を選択できることがわかります。

3 つの主要なデータ タイプ: これは、実際には時系列を細分化したスニーク エクスチェンジの概念に属しており、実際のデータ タイプではありませんが、販売データを処理するときによく発生するものです過去、現在、未来を分割する座標軸上にデータを配置します。

過去最大のデータ型

過去のデータとは、過去のデータ、つまりすでに起こったデータを指します。

機能: 知識を要約、比較、洗練するために使用されます。

例: 過去の店舗運営データ、返金データ、注文データ

現在 2 番目に大きいデータ型

[現在] の概念は比較的曖昧で、時間単位によっては、今日、今月、今年のすべてが現在のデータになる可能性があります。日を単位にすると、今日のデータが現在のデータになります。現在のデータと過去のデータを比較することによってのみ、自分が今どこにいるのかを知ることができ、現在のデータだけではあまり役に立ちません。

機能:現状把握と課題発見に使用

例: その日のデータを保存する

将来的には 3 番目に大きいデータ型

未来データとは、まだ発生していない、予測によって得られるデータを指します。例えば、計画を立てたり、予算を立てたりするときに、その時点ではまだ届いていないんですけれども、データはもうあるんです。このデータは参考値であり、100%予測できるものではなく、多少の誤差が生じます。

機能: 予測に使用されます

例:店舗計画、販売計画

3 種類のデータは一方向に流れ、未来はやがて現在になり、やがて過去になります。

たとえば、データを座標軸に配置し、期間ごとに分割すると、各データの役割が非常に明確になります。

おすすめ

転載: blog.csdn.net/u014156887/article/details/133137644