皆さん、こんにちは。編集者が次の質問に答えるためにここにいます。Python データ分析ケース、薬局販売データ分析、Python データ分析ケース、Baidu Netdisk の大仕事、それでは見てみましょう。
1. 準備
分析には NumPy と Pandas の 2 つのパッケージが必要です。まず、これら 2 つのパッケージが jupyter に正常にインストールされていることを確認します。
#导入numpy包
import numpy as np
#导入pandas包
import pandas as pd
2. 基礎知識
2.1 1 次元データ分析: NumPy
2.2 1 次元データ構造: Pandas
2.3 2 次元データ分析: numpy は配列に対応
2.4 2 次元データ分析: pandas はデータ フレーム DateFrame に対応します
ここで問題が発生しました: Excel ファイルの読み取り時にエラーが報告されました。 Python による運用とメンテナンスの自動化
解決:
1 Excelファイルの保存パスを確認する
具体的な操作: ファイル名をクリックし、マウスを右クリックして [プロパティ] を選択し、以下の赤でマークされた 2 つの場所を見つけます。
2 上の赤でマークされた 2 つの場所を結合して、ファイル パスを結合します。
形式はフォルダー\ファイル名です (F:\ann\Untitled1.ipynb など)。
3 最後に、パス内のすべてのスラッシュ (/) またはバックスラッシュ (\) を二重バックスラッシュ (\) に置き換えます。
最終的なパスは F:\ann\Untitled1.ipynb です。
3. Python 固有のケース分析: 薬局の売上データ
3.1 質問する
分析指標:
月間平均購入数
月間平均消費額
単一顧客アイテム
消費傾向
3.2 データについて
3.3 データのクリーニング
3.3.1 サブセットの選択
3.3.2 列名が繰り返されるネーミング
3.3.3 欠落データ処理 (dropna() 関数)
Python の欠損値には、None、NA、NaN の 3 種類があります。 (データを分析するときに、float エラーなどのエラーが発生した場合は、欠損値があるかどうかを考慮する必要があります。欠損値がある場合は、処理する必要があります。)
- Python の組み込みの None 値。
- パンダでは、欠損値は NA として表されます。これは、利用できないことを意味します。
- 数値データに対応して、pandas は浮動小数点値 NaN (Not a Number) を使用して欠損データを表します。
None と NaN の違い: None は Python のデータ型 (NoneType)、NaN は浮動小数点型 (float) で、どちらも null 値として使用されます。
3.3.4 データ型変換
3.3.5 データの並べ替え
3.3.6 外れ値の処理
3.4 モデルの構築
3.4.1 指標 1: 月間平均消費量 = 総消費量 / 月数
3.4.2 指標 2: 月間平均消費量 = 総消費量 / 月数 a>
3.4.3 指標 3: 顧客単価 = 総消費額 / 総消費数
顧客当たり取引額:ショッピングモール(スーパーマーケット)での顧客一人当たりの商品の平均購入金額であり、平均取引金額です。
3.4.3 消費動向
やっと
Python の学習で問題がある場合は、WeChat で以下の CSDN 公式認定 QR コードをスキャンして、Python のコミュニケーションと学習に参加できます。
質問を交換したり、お互いに助け合ったりできます。良いものはここにあります チュートリアルと開発ツールを学びます。
(Python パートタイム リソース + Python 学習教材のフルセット)
1.Pythonの全方位学習ルート
Pythonの全方位の技術要点を各分野の知識をまとめてまとめており、上記の知識に応じて対応する学習リソースを見つけることができ、より包括的に学習できるのが便利です。
2. Python の必須開発ツール
3.Python動画集
ゼロベース学習ビデオを見る。ビデオを見るのが最も速く、最も効果的な学習方法です。基礎から詳細まで、ビデオ内の教師のアイデアに従うことで簡単に始めることができます。
4. 実践事例
光学理論は役に立ちません。学んだことを実際に適用するには、それに従って練習する必要があります。このとき、いくつかの実際の事例から学ぶことができます。
5. Python の演習
学習結果を確認します。
最後に、あの時の情熱を決して捨てずに、一緒にもっと強くなっていきましょう。