Pythonの5つの一般的なデータ解析ライブラリ

序文

Pythonは、多くの場合、一般的にデータ解析ライブラリで使用される使用済みのデータ分析ツールでたくさん持っている、以下の分析は、次の5つのライブラリに焦点を当て:numpyの、パンダ、scipyのダウンロード、StatsModels、matplotlibの。

numpyの

numpyのは非常に一般的に使用されるデータ解析ライブラリで、以下のパンダもnumpyのに依存含め、より正確なポイント数学ライブラリであることを述べました。なぜnumpyのを言って、彼は利点は何ですか?

  1. 多くの組み込みの数学的計算:あなたは、あなたがしなければならないことを、ここを参照してください記事は、仕事や人工知能の高い確率、機械学習や仕事関連のデータ分析、これらのジョブのない単純にスタックコード・ロジック、およびより多くの数学です慎重にフーリエ展開あなたの手を必要とせずに、numpyのにこれらの操作を構築することができ、アプリケーションは、多くの場合、行列計算、基本的な線形代数演算、確率的シミュレーションを必要とし、フーリエ変換します。
  2. 高速:たとえば、乗算の行列aとbが直接* B(要素製品)や、@ bの(行列積)を書き込むことができ、書き込みサイクルを渡します、あなたが推測している可能性があるため、より速くよりも、それが事前にありますCコードをコンパイルしたり、より良いキャッシュ戦略を使用して、効果がある、そうしない理由はありません。
  3. コードは単純です:上記の文言行列の乗算比サイクルは、読みやすくするためでしょう、少ないコード手段が少ないバグ。

人生は短いです、データ解析を行い、パイソンを使用されている、numpyのを知って、それの良い、あなたはより深い理解を持つことになります。

パンダ

パンダは、データ分析とモデリングツールのライブラリの学生であるPythonのデータ解析ライブラリは、パンダは、多くのデータモデルが含まれていますが、また、上記のパンダがnumpyのに依存し、また、ここで推奨されているように、他のライブラリ上の利点の多くを吸収しますnumpyの、その後はパンダを理解することを学びます。パンダは、具体的には、関数とデータ処理の多くの方法を提供する大規模なデータセットのための独自の利点があり、その作成は、金融背景を有しているので、そう時系列解析や経済性の点で独自の利点を有すること。

matplotlibの

matplotlibのは、2Dグラフィックスライブラリです。データ特性解析する前に前のデータの束、または巨大なデータテーブルは、このようなタスクは、もう少し難しい人間の目には、しかしグラフィックに変換した場合、それは別の感覚です。数行のコードは、このようなデータ分析のためのツールとして、正確なヒストグラム、棒グラフ、エラーや散布図を描くことができ、それはダイアーティファクトです。

上記はもちろん、一部の人は本当に私はこれを否定しませんが、私は個人的に、一部の人々はまだトップ3は、3本の柱のPythonのライブラリーデータ分析であると考え、同様に他のライブラリやツールを言うだろう(三本柱のPythonのデータ分析であります)、以下は単なる学習ツールのライブラリを知っている井戸の価値として、他の3を分析し続けます。

scipyのダウンロード

多くの人々はまた、scipyのダウンロードが柱のツールキットとして、我々はそれが非常に重要である見ることができますしたいです。scipyのダウンロードもscipyのダウンロード科学計算も抽象度の高いと物理モデル、一体型差信号処理の多くが含まれている工具マガジン、ある、numpyのに依存します。

状態モデル

StatsModelsは(StatsModelsターンがパンダに依存するため、パンダが行うことができます)多くの統計モデル、線形モデル、モデルの線形一般化、分散分析、時系列が含まれており、このようなユーティリティなどの混合モデルの線形統計の面で独自の利点があります。

追伸

データ分析のためのPythonライブラリ、私は一緒に、それらの間に本当に近い接続を言うために、多くの場合、1つ別の索引にリンクされている公式サイトも存在している、お互いをお勧めします、彼らは本当に暖かさのために一緒に保持します。そして、それらの中の一部の機能はやや繰り返し、しかし、避けられない。この点に、異なる強調を持っているいくつかの基本的な操作のデータ分析は、彼らがそれらの基本的な機能を置くことができないライブラリ、同じであるため、マスクされました。私たちのために、私たちはしばしば、異なるツールのライブラリを使用して、別のジョブまたはタスクである程度の知識を持っている必要があります。

手順を学ぶために、私のアドバイスは、特定のAPIをゆっくりマスタにプロセスを学習した後、基本的な使用を学習した後、3本の柱(numpyの、パンダとmatplotlibの)文書を見てみることです。

おすすめ

転載: www.cnblogs.com/renyuzhuo/p/12222578.html