アイ・ウェンウェンのプログラミング「Pythonゼロベーシック入門」(01) Plotlyをベースにしたダイナミックなビジュアル描画

著者: Ai Wen 氏。コンピュータ サイエンスの修士号を取得し、社内トレーニング講師および金賞面接官を務め、社内の上級アルゴリズム専門家であり、現在は BAT の第一級工場で働いています。
電子メール: [email protected]
ブログ: https://wenjie.blog.csdn.net/
内容: Ai Wenjie によるプログラミング「基礎ゼロから学ぶ Python」

目標

  • プロットの基本概念の紹介
  • プロット描画コントロールの概要
  • 計画的にインストールする
  • プロットグラフの視覚化を描画する
  • 視覚化チャート (ヒストグラム、ヒストグラム、散布図、円グラフ、ヒート マップ、タイミング ダイアグラム、箱ひげ図など)

コンテンツ

  • 導入¶

データ分析用の Python をベースにした Matplotlib には、十分に美しくない、静的である、共有が難しいなどの欠点があり、データ視覚化における Python の開発が制限されています。この問題を解決するために、新しい動的視覚化オープンソース モジュールである Plotly が登場しました。なぜなら、Plotlyはダイナミックで美しく、使いやすく、種類が豊富であるという特徴を持っているからです。プロジェクトのケースには、視覚的なチャート分析のためのタイタニック号データ、虹彩データ、飛行データ、財務データが含まれており、これにより、プロジェクトでのデータ分析の対処方法を全員がすぐに知ることができます。

プロジェクトの実際の内容: タイタニック号データ、虹彩データ、飛行データ、財務データ

  • 必要とする

ゼロベースの人でも、Python の基礎をある程度知っている学生でも、このコースを通じて学ぶことができます。このコースは実践的なチュートリアルを中心に、Python ツールの使い方や jupyter-notebook を使ったデータ分析の方法をすぐに習得でき、インタラクティブなグラフをプロットすることでビジネスの真の理解を得ることができます。これらのコースは、特に AI プロダクト マネージャーにとっても非常に役立ち、企業のデータ分析をより迅速かつ効率的に行い、仕事を最大限に活用することができます。

  • から利益を得る

Plotlyライブラリの使い方をすぐにマスターし、さまざまなデータ分析でよく使われるグラフを上手に描画しましょう

Pythonのデータ分析手法をマスターする

プロットの紹介

Python 描画: matplotlib、seaborn、plotly

データ分析のビジネス シナリオの 1 つは、データを使用してストーリーを伝えることですが、インタラクティブな情報視覚化ツールはここでの利点を強調します。

Python の視覚化ライブラリはまだたくさんありますが、matplotlib と seaborn をマスターし、特定のビジネス向けに plotly を使用するだけで、ほとんどのデータ分析シナリオに冷静に対処できます。

Plotly は非常に有名で強力なオープン ソース データ視覚化フレームワークであり、ブラウザーの表示に基づいてインタラクティブな Web ベースのグラフを構築することで情報を表示し、多数の美しいグラフや地図を作成できます。

以下では、データ分析のための開発ツールとして jupyter Notebook を使用します。Matplotlib には、十分に美しくない、静的である、共有が容易ではないなどの欠点があり、データ視覚化における Python の開発が制限されます。この問題を解決するために、新しい動的視覚化オープンソース モジュールである Plotly が登場しました。

なぜなら、Plotlyはダイナミックで美しく、使いやすく、種類が豊富であるという特徴を持っているからです。

Pythonでチャートを描画する場合、plotlyは最上位の描画メソッドであると言えます。

まず、plotly 公式 Web サイトからデータ ビジュアライゼーション レンダリングを見てみましょう。ここでエフェクトの一部をインターセプトすると、非常に強力であり、データ/画像のオンライン編集もサポートしていることがわかります。

プロット描画コントロール

基本チャート:20種類

統計・配送経路マップ:12種類

科学図表:21種類

財務チャート:2種類

マップ:8種類

3Dチャート:19種類

レポート生成:4種類

接続データベース:7種類

フィッティングツール:3種類

フローチャート:4種類

カスタムコントロールを追加するJavaScript:13種類

計画的にインストールする

pip インストールをプロットする

Chengxiu の巧妙なインストールが完了したら、次の操作を通じて Chengxiu がインストールされているかどうかを確認する必要があります。

最初のプロットグラフ視覚化

  • 関連パッケージをインポートする

  • 最初にグラフを描いた人

表示結果は以下の通り

ビジュアルチャートデータケース

このコースのすべてのプロジェクト ケースのデータには、タイタニック データ、アイリス データ、フライト データ、財務データが含まれており、これらのデータの分析を通じて、誰もがデータ描画分析のためのプロジェクトのプロットをすぐにマスターできるようになります。

  • データのダウンロード

  • 4 種類のデータを表示 (デフォルトは 5)

ここでフライトはピボット関数によって処理されます

財務データ表示

プロジェクト ケース 1: タイタニック号のヒストグラム

一連のデータを分析するときに注目するのは変数の分布であり、ヒストグラムはそのような非常に単純な機能を提供します。

データを観察して、年齢のヒストグラムを表示します。実際の年齢データには欠損データがあります。まず、dropna 関数を使用して欠損データを削除しないと、グラフが描画できません。

プロジェクト ケース 2: タイタニック号のヒストグラム

ここでは、各職位レベルのデータ分析に対応する生存者数をカウントします。

プロジェクト ケース 3: タイタニック号のグループ化ヒストグラム

X 軸の位置レベル クラスでは、グループ化されたヒストグラムの効果を完成させるために性別を調整します。

プロジェクト ケース 4: アイリス散布​​図

散布図: 主にデータの集中度を分析するために使用されます。

プロジェクト ケース 5: 飛行データの折れ線グラフ

主にデータの変化傾向を分析します ここではフライトデータを分析し、主に年別および月別の乗客数の変化に注目します。

上記の操作は非常に面倒ですが、各年のデータをカプセル化する関数を定義すれば、全てのデータを表示することができます

プロジェクト ケース 6: タイタニック円グラフ

円グラフを通じて、主にデータのさまざまなカテゴリの割合を分析するために使用されます。

さまざまな乗船者の生存者の割合を分析する

プロジェクト ケース 7: タイタニック号の箱ひげ図

異常点データ、外れ点データを問わずデータ解析機能の一種で、一連のデータの最大値、最小値、中央値、上位四分位データ、下位四分位データを表示することができます。このデータはこのグラフで確認できます

さまざまな役職レベルの年齢分布をカウントします

上記のコードをさらに最適化および調整して、コードを見やすくし、コードを減らすことができます。

プロジェクト ケース 8: 飛行データのヒート マップ

通常、特徴間の相関関係を示すために使用され、色の深さは通常、値の大きさまたは相関関係のレベルを示すために使用されます。

まず、簡単なデータ例を使用して、3 つの変数 x、y、z のデータの構築に焦点を当てて、ヒート マップを生成する方法を観察してみましょう。

次に、パンダを介してフライトの 1 つのデータ、つまり年間 1 か月あたりの乗客数をロードします。これはヒート マップの実用的な応用です。

ヒートマップを構築するために必要なのは3次元のデータ情報です

x: 月ラベル

y: 年のラベル

z:年月に対応する乗客数

プロジェクト ケース 9: 財務データのシーケンス図

タイミング図を使用して各時点でデータを変更できます。たとえば、次のようになります。金融分野では、この方法を使用して毎日の株価の傾向を分析できます。

財務データの日次株価推移の統計

次に、関数をさらに最適化します。

さらに多くのコンテンツを学習するには、注目して、もっとコメントし、もっとサポートしてください。一緒に働きましょう。

おすすめ

転載: blog.csdn.net/shenfuli/article/details/127958762