あなたがより簡単に科学的なデータを学ぶことができます15 Pythonライブラリ!

過去5年間では、Pythonは一般的なデータ科学コミュニティとなっています。したがって、それはゆっくりとR-上で「統計用語」を取っている-多くのツールの好適なツールとして。最近リリースされたスタックオーバーフロー開発調査2018年のショーでは、Pythonは、業界での使用が増加していきます、重要なプログラミング言語です。Pythonの衝撃的な上昇が、驚くべきことではありません。その汎用性は、効率性と使いやすさと組み合わせて、あなたがより簡単にデータ科学を構築することができます。また、基本的なWebクロールから深い学習モデルを訓練の複雑なタスクに、すべての科学的データ関連のタスクを処理するためのPythonライブラリの富を使用することができます。
この記事では、我々は最も人気があり、広くPythonライブラリとそのアプリケーションを使用する領域のいくつかを紹介します。

ウェブクロール


ウェブブラウザの助けを借りて、ウェブクローリングは、ネットワーク情報抽出技術からHTTPプロトコルを使用して人気があります。二つの最も一般的なWebクローラーは、Pythonのに基づいています。

1.Beautifulスープ

美しいスープは、HTMLやXMLファイルから情報を抽出するために、人気のPythonライブラリです。それはあなたの不必要な作業時間を節約することができ、データ解析を、ナビゲート、検索、および変更するためのユニークかつ簡単な方法を提供します。それは、2.7および3.x、および非常に使いやすいですPythonの両方のバージョンに適用されます。

2.Scrapy

Pythonで書かれたScrapyは、無料のオープンソースフレームワークです。ウェブクロール用に開発されたが、それは、従来のWebクローラとしても使用することができ、データを抽出するために、さまざまなAPIを使用していますが。Djangoのようなフレームワークに従っ哲学を「自分自身を繰り返してはいけない」、爬虫類Scrapyは自己完結型のセット、具体的な指示特定のターゲットに従っ一人ひとり爬虫類が含まれています。

  • コードに喜んヒント

ScrapyのURL:https://scrapy.org/

科学的なコンピューティングとデータ分析


これデータ科学者のための非常に貴重な証明し、データ処理や解析、および数学的な計算のためのユニークなライブラリーを提供することにより、科学的データのおそらく最も一般的なタスク。

3.NumPy

Pythonはscipyのダウンロード(後述)と呼ばれ、科学的なコンピューティングスタックのための大規模のPythonの一部であり、最も人気のあるnumpyの科学技術計算ライブラリ、です。線形代数と他の数学的関数の使用に加えて、それは容器または多次元配列の任意のデータ型を有する共通のデータとして使用することができます。

numpyのシームレスな統合言語(例えば、C / C ++)、およびそれがデータ型のさまざまなサポートしているので、それはまた、様々なデータベースに適用されます。

  • コードに喜んヒント

numpyのURL:http://www.numpy.org/

4.SciPy

scipyのダウンロードは、オープンソースのライブラリの数学的、科学技術計算とデータ分析を含むPythonベースのフレームワークです。scipyのダウンロードライブラリは、高度な数学や統計アルゴリズムやツールのコレクションです。:scipyのダウンロードスタックは以下のライブラリが含ま
-数値計算のためのPythonパッケージ・numpyの
scipyのダウンロードは、信号処理、最適化のためのスタックコアパッケージの一つであり、高度な統計-・scipyのダウンロード
・matplotlibの-データの可視人気のPythonライブラリのための
SymPy・を-シンボリック数学と代数ライブラリ
・パンダ- Pythonライブラリのデータ操作および分析のための
Pythonベースのインタラクティブコンソールを実行するために使用されるコード-・iPython

  • コードに喜んヒント

scipyのダウンロードURL:https://www.scipy.org/index.html

5.Pandas

パンダPythonパッケージは、データ構造、データ操作と分析を提供するために広く使用されており、効果的なツールです。それは定量分析のために広く使われているツールであり、アルゴリズム取引とリスク分析におけるアプリケーションの多くを発見しました。
これは、新しいAPIの変更、パフォーマンスのアップデートとバグフィックスを取得するために、専用のユーザーの大規模なコミュニティ、定期的に更新パンダを持っています。

  • コードに喜んヒント

パンダのURL:https://pandas.pydata.org/

機械学習と深い学習


Pythonはちょうど図書館のその、多様な効果的かつ簡単に使用できる一連のおかげで、効率的に実現するための機械学習と深い学習モデル内のすべての他の言語よりも優れています。このセクションでは、機械学習と深い学習のための最も人気があり、最も一般的に使用されるPythonライブラリの一部が表示されます。

6.Scikit-学びます

データマイニング、最も人気のあるPythonライブラリと機械学習の分析のためscikit-学びます。これはnumpyの、scipyのダウンロードmatplotlibの機能的な建物を使用し、市販されています。あなたは、このような分類、回帰、クラスタリング、およびインストールが非常に簡単のように機械学習の様々な技術を実現するために、学ぶscikitを使用することができます。

  • コードに喜んヒント

scikit-学ぶWebサイト:https://scikit-learn.org/stable/

7.Tensorflow

Tensorflowは、機械学習と学習のCPUまたはGPU有効な深さの複数の使用のためのPythonベースのフレームワークです。Googleがサポートされ、もともとGoogleの脳の研究チームが開発し、機械知能フレームワークは広く世界で使用されています。また、アクティブユーザーの数が多いの支援を得て、広く製造業と小売業から医療やスマート車に、高度な機械学習の様々な産業分野で使用されています。

  • コードに喜んヒント

Tensorflow URL:https://www.tensorflow.org/

8.Keras

Kerasは、PythonベースのニューラルネットワークのAPIである単純化されたインターフェースは、あなたの深さの学習モデルを訓練し、展開することが容易になります提供します。それは、このようなTensorflow、Deeplearning4j CNTKと非常にユーザーフレンドリーなどのフレームワークを、学習や、モジュラーアプローチは、CPUとGPUを計算サポートし、以下のさまざまな深さをサポートしています。あなたがより簡単に、より効果的な学習プロセスの深さが必要な場合は、ライブラリーは、試してみる価値があり!

  • コードに喜んヒント

KerasのURL:https://keras.io/

9.PyTorch

PyTorchが深い学習のPythonのシリーズの最新メンバーの一人である、それは強力なGPUのサポート、ニューラルネットワークモデルライブラリです。まだベータ版であるが、しかしこのプロジェクトは、FacebookやTwitterなどの偉大な人によってサポートされていました。PyTorchは、より効率的なテンソル計算と動的ニューラルネットワークを実現するために、ライブラリトーチの深さ別の人気のアーキテクチャ上に構築されました。

  • コードに喜んヒント

PyTorchのURL:https://pytorch.org/

自然言語処理


自然言語処理は話さ人間の言語、または書かれたシステムを分析し、解釈し、設計プロセスを必要とします。Pythonは、このようなように構造化および非構造化テキスト、予測分析、およびの使用など、さまざまなタスクを実行するために、独自のライブラリを提供します。

10.NLTK

NLTKは、人気の高い言語処理のPythonライブラリです。それは、そのようなので、上のテキスト分類、表示、テキストの構文解析、意味的な推論やなどNLPタスクのさまざまな使いやすいインターフェイスを提供します。これは、オープンソース、コミュニティ主導のプロジェクト、とPython 2とPython 3のサポートです。

  • コードに喜んヒント

NLTKのURL:http://www.nltk.org/

11.SpaCy

スペイシーは、高レベルのPythonとCythonに基づいて、他の自然言語処理ライブラリです。それは、このようなTensorflowやPyTorchとしてライブラリやフレームワークを、学習広い範囲の深さをサポートしています。スペイシーを使用して、あなたは比較的簡単に複雑な統計モデルNLPを構築することができます。スペイシー簡単にインストールして使用、非常に有用であることが証明された大規模なテキスト情報の観点で抽出して分析しました。

  • コードに喜んヒント

スペイシーURL:https://spacy.io/

データの可視化


データの可視化は、広く科学技術データで使用され、グラフ、チャート、およびレポートのダッシュボードを通じて、視覚的に分析し、貴重なビジネス洞察に情報を送信するためです。Pythonは、効率的なデータ記述のための多くの一般的なデータベースを提供します。これらのいくつかを以下に示します。

12.matplotlib

matplotlibのは、エンタープライズレベルの2Dおよび3Dグラフィックスを可能にする最も一般的なデータ可視化のPythonライブラリです。あなたは、このようなようにヒストグラム、棒グラフ、散布図、およびとして、可視化の異なるタイプを構築するために数行のコードを使用することができ、matplotlibのを使用してください。R絶賛ggplot2と同等人気のmatplotlibのは、matplotlibのは、データの可視化の必要性を作成し、共有するために必要なすべてのツールを提供するために、iPythonとJupyterラップトップを含め、すべてのPythonコンソール上でシームレスに実行することができます。

  • コードに喜んヒント

matplotlibののURL:https://matplotlib.org/

13. Seaborn

Seabornはmatplotlibの由来Pythonベースのデータ視覚化ライブラリです。魅力的で洞察に満ちたデータの可視化加算を提供することに加えて、seabornはまた、numpyのやパンダなどの他のPythonライブラリに強力なサポートを提供しています。

  • コードに喜んヒント

SeabornのURL:httpsを://seaborn.pydata.org/in ...

14.ボケ

ボケは、Pythonベースのインタラクティブなデータ可視化ライブラリです。最新のWebブラウザ上で実行主に、D3.jsエレガントなスタイルのグラフィックスと可視化を提供するように設計されています。様々な視覚的なアウトサイダーを作成する機能に加えて、ボケも大規模な相互作用と可視化のリアルタイムのデータ・セットをサポートしています。

  • コードに喜んヒント

ボケのURL:httpsを://bokeh.pydata.org/en/l ...

15. Plotly

Plotly Pythonライブラリは広く出版品質のグラフの生産のために世界中で使用されています。あなたは簡単にインタラクティブなダッシュボード、散布図、ヒストグラム、ローソク足チャート、ヒートマップ、およびその他のデータの可視化の多くを構築することができ、Plotly使用してください。優れたインタラクティビティ、展開、およびパブリッシング機能により、Plotlyは、効果的なデータ記述のために、異なるフィールド、主に金融・地理空間産業で使用することができます。

  • コードに喜んヒント

Plotly URL:https://plot.ly/python/

Pythonは、科学的データに関連付けられている各タスクのためのライブラリの拡張セットを提供し、各ライブラリは、ユニークな機能が装備され、あなたが迅速かつ容易にタスクを完了することができます。そこに多くのPythonライブラリですが、が、我々は彼らの人気、有用性と彼らがもたらす価値に応じて15個のライブラリを選択することができます。

pythonを学習するときに我々は確かに新しい技術の追求だけでなく、多くの困難に遭遇する、ここで私たちはPythonのバックルqunを学ぶお勧めしますものです:784758214、ここではPythonの学習者が集まる場所です!同時に、彼はゼロベースのデータに対処するためにWeb開発に基本的な、爬虫類、ジャンゴ、データマイニングや他のプロジェクトから上級開発エンジニアパイソン、Pythonスクリプトだっ仕上げています。どんな小さなPythonのパートナーに与えられました!毎日の株式学習と細部に注意を払う必要がありますいくつかの方法

おすすめ

転載: blog.csdn.net/zhizhun88/article/details/92012085