機械学習を得るために100日| 9.3のブッククレソンのスコアをお勧めしますday45-53:「Pythonのデータの科学ハンドブック」

ファイル
「Pythonのデータ科学ハンドブック、」5つの章の合計の1つのまたは2つのPythonのデータ科学の焦点ツールキットに各献身的。第2章では、効率的に格納し、Pythonを使用して大規模な配列を操作することができるndarrayオブジェクトnumpyのを提供説明;まずIPythonとJupyter開始は、それらがデータ科学者が必要とするコンピューティング環境を提供する第3章は、一般的にデータフレームオブジェクトパンダを提供に関し、効率的に格納し、タグ/柱状のデータは、Pythonを使って操作することができる。主人公は、第4章matplotlibのは、それは、Pythonの多くのデータの可視化を提供しています。第5章主Scikit・ラーンのライブラリーを最も重要な機械学習アルゴリズムは、Python実装の効率的なクリーンバージョンを提供しています。

この本のフレームワーク:

第2章:numpyの紹介

2.1 Pythonでデータ型を理解して

2.2 numpyのアレイベース

2.3 numpyのアレイ計算:一般機能

2.4重合:MIN、MAX、およびその他の値

アレイの2.5計算:ブロードキャスト

2.6比較、マスク、およびブール演算

2.7ファンシーインデックス

ソート2.8アレイ

2.9構造化データ構造化のnumpyの配列

3頭のパンダデータ処理

3.1パンダは、はじめにオブジェクト

3.2データ値と選択肢

3.3パンダ数値計算方法

欠損値で3.4契約

3.5レベルのインデックス

合わせたデータセット3.6:連結と追加方法

組み合わせたデータセット3.7:マージ接続

3.8累積パケット

3.9ピボットテーブル

3.10文字列操作のベクトル化

3.11の時系列

3.12高性能パンダ:evalの()照会します()

4 matplotlibのデータの可視化

4.1簡単な線グラフ

4.2簡単な散布図

4.3可視化例外処理

図4.4密度等高線プロット。

4.5ヒストグラム

4.6構成の伝説

4.7カラーバーの設定

以上480サブグラフ

4.9テキストとノート

4.10塗装三次元マップ

中国語版ダウンロード:

https://github.com/MachineLearning100/100-Days-Of-ML-Code/blob/master/Other%20Docs/Pythonデータ科学ハンドブック.zipファイル

そして、ケースコード:

https://github.com/jakevdp/PythonDataScienceHandbook

おすすめ

転載: www.cnblogs.com/jpld/p/11409767.html