データ分析の知人
1.データ分析とは何ですか
21世紀では、最も重要なのは、データをマスターデータは、ある21世紀の生命線を把握し、データ解析は、私たちは、これらのデータツールで役割を果たしできるようにすることです
2.データ分析を行うことができます
「」 ' 私たちは実際には、単にいくつかの例を行うことができ、データ分析のために: 1を、淘宝網は、ユーザーの購入履歴の内容を観察履歴を検索するだけでなく、人々がソーシャルメディアに投稿することができ、製品の推奨を選択 2を、対応する在庫データに基づいて売買選択 3を、今日の見出しは、ニュースフィードの中のランキングデータ分析アルゴリズムに適用することができる 4、iQIYIはするユーザーのためのパーソナライズされた映画推薦サービスを提供することができ 、実際にだけでなく、データを分析し、製薬業界では、推薦システム上のものと同様に行うことができますまた、化合物が、より効果的な薬を作ったかもしれないものを予測するためのデータ分析を使用することができ 、データ分析は、すべての会社の位置、社会的、そんなにデータにあまりにも多くのデータを取得する現在の方法の将来に不可欠である限りとして、我々は間違いなく仕事上の任意の作業にも対応でき、スキル、データ分析を持っています。 「」 '
3.データ分析のプロセス
「」 ' 1案 データ編成2. 照合データは、3つのステップに分けられる: (1)データの収集 にJupyterノートブックに様々なチャネルを介してデータを取得する (2)データを評価し 、それが主要なステップを見つける必要が品質や構造におけるデータの問題かどうか (3)、データをクリーンアップ 置き換え、修正することにより、削除などの高いデータ品質を確保するために、良い構造 3.データ解析 データ解析のためのnumpyのを使用して、パンダやその他のツール の結果4。及びディスプレイ 表示のためのmatplotlibのを使用して などのHadoop、火花を用いて、大量のデータ:PS '「」
4、一般的に使用されるライブラリの紹介
numpyの
数値Pythonのnumpyのは、それがメインの数値のPythonのために使用することができ、簡略化したものです。それは主にインタフェースを必要数値計算を含むデータ構造、アルゴリズム、及びパイソンの多様を提供します。
高速、効率的な多次元配列オブジェクトndarray
配列要素及びアレイに基づく演算関数の直接計算
データセットに基づいて、ツールの読み取り書き込みハードドライブアレイは
、フーリエ変換、及び代数演算線形乱数生成
のためのC、C ++、PythonのツールにFortranコード
パンダ
パンダは私たちを行ったデータ分析のための主要なツールとなっています。
それはPythonとデータ解析は非常に迅速な清掃が含まれていることを、このようなツールを処理するデータ構造とデータのデザイン。
パンダは、一般的に言語サポートは、コンピューティングの最もnumpyのスタイルの配列、他の数値のツールと組み合わせて使用されています。
パンダとの最大の違いは、異種または表形式のデータを処理するために使用されるnumpyのパンダである、とnumpyのは、それが均質タイプベースのデータ値の配列を処理するためのより適切な反対で正確です
matplotlibの
matplotlibのは、チャートのPythonライブラリを描画するために使用される最も一般的なデータです。
scipyのダウンロード
scipyのダウンロードは、さまざまな標準問題領域のための科学的なコンピューティング・パッケージのコレクションです。強力な科学技術計算(行列解析、信号解析、数学的分析など)を提供します
IPythonとJuypyterノート
IPythonがPythonインタプリタの拡張バージョンである、Juypyterノートブックはまた、もともとIPythonプロジェクトから、Webベースのコードのノートブックです。
2 .Ipythonのインストールと使用
インストール
PIP3 ipythonインストール
主に、端末缶書き込みPythonコードでipython、彼と書かれたネイティブのpython3の使用はipythonの使用を強調し、異なっている私たちを記述するために、コードをより便利に
そして、もっと優しい書き込みにパッケージや他の操作上の私たちにいくつかのヒントを与えることができ、相対ネイティブのタブキーを使用
ipythonを使用した後
私たちは、端末のテストでいくつかの小さなコードでipythonで達成することができる必要があることの後
.jupyterノートブックの3のインストールと使用
2つのインストールと起動モード
コマンドラインモード
インストール:
PIP3はjupyterインストール
を開始:
アクティブにしたいディレクトリを入力します:jupyterノート
このコマンドラインは、手動での追加的なデータ分析パッケージをインストールする必要があります。
します。https:最初の公式サイトを入力し//www.anaconda.com/
対応するバージョンをダウンロードすることを選択します
インストールプロセス赤い部分がチェックされていない、他のデフォルトの選択
アナコンダの方法を使用したソフトウェア
長所:それは約200科学計算パッケージを中心に基本的なデータ解析パッケージが含まれています
1.anacondaの基礎特長
2.jupyterのノートブックは、エディタ機能します
新しいファイルのpython3を作成します。
ショートカット
ショートカットの セルが緑色である:編集モードの セルは青です:コマンドラインモード、モード入るESC 1の動作を、現在のセルとセルは、Shift +で選択されて入力します 。2.ファイル名を指定して実行を現在のセルを、Ctrlキー+は入力 で3をセル上のユニットセルを追加、ESC + 以下4、ESC + B 5セルを削除するには、ESC +はddを スイッチングコード6および値下げ、ESC + M
これはPYファイル、彼サフィックスですipynbではないことに注意してください