データ分析を行うにはどのくらい Excel について知っておく必要がありますか

データ分析というと、多くの人は当然 Excel、SQL、Python などのツールを思い浮かべるでしょう。多くの友人が本の海に落ち、自力で抜け出すことができなくなり、よく尋ねられました、「理解するにはどれくらい学べばいいの?」

今日は最も単純な Excel について話しましょう。

1. .Excel は何をするものですか?

Excel はデータ分析専用のツールではありません。Excel は表を処理するための基本的なツールであり、単純な表の作成に加えて、表に基づいたデータ計算、データ チャートの描画、および統計/運用調査の数式が含まれています。また、コードを一切書かずに利用できるため、導入難易度は非常に低いです。

2. データ分析における Excel の用途は何ですか?

まず質問してください: データ分析の仕事は何ですか?

簡単に言うと、次の 5 つの部分があります。

  • 生データを保存する
  • リクエストに応じてデータを抽出する
  • 必要に応じてデータを計算する
  • データをグラフ化する
  • データを解釈して結論を​​導き出す

この 5 つの部分は Excel で実現できます。また、Excel は操作が非常に簡単なので、データの初心者への啓発ツールとして非常に適しています。

では、どうやって Excel を知っているのでしょうか?

3. Excel を理解するにはどうすればよいですか?

Excel のすべての機能を 100% 理解することは理論上不可能であり、Excel の機能だけを解説した本は数百ページもの厚さがあることがわかりませんか。また、100%理解する必要はなく、データ初心者への啓発ツールとして、Excelを理解する鍵は基本4操作を理解することです。

操作 1: テーブルを作成します。データ分析の習慣がない人は、Excelでデータを提示し、最終的にデータをどう活用するかを書きます。ただし、このフォームは固すぎて再利用できないため、何度も離脱を繰り返すことがよくあります。データ分析に慣れた人であれば、ディメンションや指標を区別して簡単に計算することができ、データ操作効率が非常に高いです。

操作 2: インジケーター計算/集計計算を明確にします。データ分析の習慣がある人は、Excel を使用するときに、新しい指標を計算しているのか、古い指標のデータ全体を要約しているのかをよく知っています。このような習慣により、計算中に指標間の論理関係が明確になり、エラーが発生しにくくなるだけでなく、新たに導出された分類ラベル/指標に基づいてより多くの分析が可能になります。

操作 3: ピボット テーブルの使用に習熟する。ピボット テーブルは Excel データ分析の中核機能であり、これを使いこなすと計算が速くなるだけでなく、データ集計の概念を理解するのにも役立ちます。

操作 4 :要件に応じて適切なチャートを選択します。グラフを作成するのは簡単ですが、実際のニーズに応じてグラフを選択することがデータ アナリストの要件です。

上記の 4 つの主要な業務をマスターすれば、データ スタートアップと財務や人事を区別できるようになります。現時点では、データを水平方向および垂直方向にシャッフルするのではなく、特定のロジックと標準化に従ってデータを処理するためです。これら 4 つの主要な操作は、後で SQL、Python、その他のツールを学習する際に遭遇します。その時はExcelの操作と比べてみると分かります。

対照的に、Excel には、線形計画ツールボックス、統計テスト ツール、線形回帰モデルなどの統計/財務関数など、一見複雑に見える操作がいくつかあります。原理は非常に複雑ですが、動作は数式の計算だけなので、実際に必要なときに理解できます。複雑さと複雑さのために、その必要はありません。

4. Excelの理解からデータ分析まで

Excel を知っているだけではデータ分析は十分ではありません。なぜなら、実際のデータ分析の問題は、次のような口語的でカジュアルなものであることが多いからです。

  • 「こぐまちゃん、最近の売れ行きはどうですか?」
  • 「シオン姉妹、なぜ今回の出来事の影響が前回よりも悪いのですか?」
  • 「シオンメイちゃん、来月のパフォーマンスはどうなると予想されますか?」

Excel には上記の質問に対する回答を直接クリックできるボタンがないため、質問を自分で変換する必要があります。

一般的なニーズは次の 3 つです。

要件 1: データを提供する。たとえば、「Xiao Xiongmei さん、最近の販売状況はどうですか?」 この時点で、統計データの分類次元と指標を確認する必要があります。次に、Excel のサンプルを作成し、要求者に形式が正しいことを確認してから、データベースからデータを抽出します。

要件 2: 比較分析。たとえば、「Xiao Xiongmei、この活動の効果が前回よりも悪いのはなぜですか?」 この時点では、次の 3 つの質問について明確に議論し、Excel の例を準備して、対応するデータを抽出する必要があります。

  • 誰が誰と比較するのか
  • どの指標を比較するか
  • 分類しますか?

要件 3: 予測分析。たとえば、「Xiao Xiongmei、来月の業績の予測は何ですか?」 このとき、ビジネス側は、ビジネス モデルを使用して予測するか、アルゴリズム モデルを使用して予測するかを選択する必要があります。ビジネスモデル予測を利用する場合、ビジネスロジックや前提条件などを事前にExcelで準備する必要がある

アルゴリズム モデルの場合は、単純な時系列/回帰モデルを Excel で直接計算できます。

もちろん、複雑なモデルの場合は、Excel を難しくしないで、SPSS/Python を使用しましょう。

この変換後、Excel の操作をデータ分析作業に適用できます。

ただし、上記は単純な例にすぎず、実際のデータ分析問題はさらに複雑になる可能性があります。したがって、ビジネス側が出力の外観を見て要件を満たしていることを確認できるように、最初からExcel で適切なテンプレートを構築することがさらに必要です。ハードワークに頭を埋めて数日間コードを書き、「何を分析しているんだ!」と人々から罵声を浴びせられるのは、あまりにも悲惨なことです。ビジネス担当者と技術担当者の間の架け橋として、Excel は非常に使いやすいです。

5. なぜ Excel は置き換えられないのか

データ量が増加すると、生データを保存するタスクは通常、データベースに引き継がれます。SqlやPythonなどのツールを使用して抽出や計算を行うこともできます。したがって、今日では Excel の有用性は大幅に低下しています。しかし、それでもその立場を揺るがすことはできません。なぜなら、さらに次の 3 つの利点があるからです

メリット1:あらゆる種類の分散データを扱えるたとえば、公式アカウント、Tmall、Douyin からエクスポートされたデータなどのアンケート、外部 ppt に添付されたデータなどの背景です。これらはデータベースに入力するのが難しく、エクセルで統一的に処理できます。この時点で、concat (リンク文字列)、replace (置換コンテンツ)、Vlookup (一致フィールド) などの Excel データ クリーニングの一般的な機能をさらに習得する必要があります。

メリット2:事業部門が自ら計算できるので便利。多くの場合、企業は独自の計算を行うことを好みますが、この時点で、企業が計算したい分類ディメンションと指標を準備し、ピボット テーブルを使用して必要なものを計算するように企業側に教えることができます。何度も数えられるように古い外観を保存してください

メリット3:完成した写真をそのままPPTに配置できます。レポートを書くのは簡単です。これすべてを言うつもりはありません。

おすすめ

転載: blog.csdn.net/xljlckjolksl/article/details/132252060