「Pythonのデータ科学ハンドブック、」5つの章の合計の1つのまたは2つのPythonのデータ科学の焦点ツールキットに各献身的。第2章では、効率的に格納し、Pythonを使用して大規模な配列を操作することができるndarrayオブジェクトnumpyのを提供説明;まずIPythonとJupyter開始は、それらがデータ科学者が必要とするコンピューティング環境を提供する第3章は、一般的にデータフレームオブジェクトパンダを提供に関し、効率的に格納し、タグ/柱状のデータは、Pythonを使って操作することができる。主人公は、第4章matplotlibのは、それは、Pythonの多くのデータの可視化を提供しています。第5章主Scikit・ラーンのライブラリーを最も重要な機械学習アルゴリズムは、Python実装の効率的なクリーンバージョンを提供しています。
この本のフレームワーク:
第2章:numpyの紹介
2.1 Pythonでデータ型を理解して
2.2 numpyのアレイベース
2.3 numpyのアレイ計算:一般機能
2.4重合:MIN、MAX、およびその他の値
アレイの2.5計算:ブロードキャスト
2.6比較、マスク、およびブール演算
2.7ファンシーインデックス
ソート2.8アレイ
2.9構造化データ構造化のnumpyの配列
3頭のパンダデータ処理
3.1パンダは、はじめにオブジェクト
3.2データ値と選択肢
3.3パンダ数値計算方法
欠損値で3.4契約
3.5レベルのインデックス
合わせたデータセット3.6:連結と追加方法
組み合わせたデータセット3.7:マージ接続
3.8累積パケット
3.9ピボットテーブル
3.10文字列操作のベクトル化
3.11の時系列
3.12高性能パンダ:evalの()照会します()
4 matplotlibのデータの可視化
4.1簡単な線グラフ
4.2簡単な散布図
4.3可視化例外処理
図4.4密度等高線プロット。
4.5ヒストグラム
4.6構成の伝説
4.7カラーバーの設定
以上480サブグラフ
4.9テキストとノート
4.10塗装三次元マップ
中国語版ダウンロード:
そして、ケースコード: