Day98データ分析(A)

データ分析の知人

1.データ分析とは何ですか

21世紀では、最も重要なのは、データをマスターデータは、ある21世紀の生命線を把握し、データ解析は、私たちは、これらのデータツールで役割を果たしできるようにすることです

 

2.データ分析を行うことができます

「」 ' 
私たちは実際には、単にいくつかの例を行うことができ、データ分析のために:

1を、淘宝網は、ユーザーの購入履歴の内容を観察履歴を検索するだけでなく、人々がソーシャルメディアに投稿することができ、製品の推奨を選択

2を、対応する在庫データに基づいて売買選択

3を、今日の見出しは、ニュースフィードの中のランキングデータ分析アルゴリズムに適用することができる

4、iQIYIはするユーザーのためのパーソナライズされた映画推薦サービスを提供することができ

、実際にだけでなく、データを分析し、製薬業界では、推薦システム上のものと同様に行うことができますまた、化合物が、より効果的な薬を作ったかもしれないものを予測するためのデータ分析を使用することができ

、データ分析は、すべての会社の位置、社会的、そんなにデータにあまりにも多くのデータを取得する現在の方法の将来に不可欠である限りとして、我々は間違いなく仕事上の任意の作業にも対応でき、スキル、データ分析を持っています。
「」 '

 

3.データ分析のプロセス

「」 ' 
1案

データ編成2. 
照合データは、3つのステップに分けられる:
(1)データの収集
にJupyterノートブックに様々なチャネルを介してデータを取得する
(2)データを評価し
、それが主要なステップを見つける必要が品質や構造におけるデータの問題かどうか
(3)、データをクリーンアップ
置き換え、修正することにより、削除などの高いデータ品質を確保するために、良い構造

3.データ解析
データ解析のためのnumpyのを使用して、パンダやその他のツール

の結果4。及びディスプレイ
表示のためのmatplotlibのを使用して

などのHadoop、火花を用いて、大量のデータ:PS 
'「」

 

4、一般的に使用されるライブラリの紹介

numpyの

数値Pythonのnumpyのは、それがメインの数値のPythonのために使用することができ、簡略化したものです。それは主にインタフェースを必要数値計算を含むデータ構造、アルゴリズム、及びパイソンの多様を提供します。

高速、効率的な多次元配列オブジェクトndarray 
配列要素及びアレイに基づく演算関数の直接計算
データセットに基づいて、ツールの読み取り書き込みハードドライブアレイは
、フーリエ変換、及び代数演算線形乱数生成
のためのC、C ++、PythonのツールにFortranコード

 

パンダ

パンダは私たちを行ったデータ分析のための主要なツールとなっています。
それはPythonとデータ解析は非常に迅速な清掃が含まれていることを、このようなツールを処理するデータ構造とデータのデザイン。
パンダは、一般的に言語サポートは、コンピューティングの最もnumpyのスタイルの配列、他の数値のツールと組み合わせて使用されています。
パンダとの最大の違いは、異種または表形式のデータを処理するために使用されるnumpyのパンダである、とnumpyのは、それが均質タイプベースのデータ値の配列を処理するためのより適切な反対で正確です

 

matplotlibの

matplotlibのは、チャートのPythonライブラリを描画するために使用される最も一般的なデータです。

 

scipyのダウンロード

scipyのダウンロードは、さまざまな標準問題領域のための科学的なコンピューティング・パッケージのコレクションです。強力な科学技術計算(行列解析、信号解析、数学的分析など)を提供します

 

IPythonとJuypyterノート

IPythonがPythonインタプリタの拡張バージョンである、Juypyterノートブックはまた、もともとIPythonプロジェクトから、Webベースのコードのノートブックです。

 

2 .Ipythonのインストールと使用

インストール

PIP3 ipythonインストール

主に、端末缶書き込みPythonコードでipython、彼と書かれたネイティブのpython3の使用はipythonの使用を強調し、異なっている私たちを記述するために、コードをより便利に

そして、もっと優しい書き込みにパッケージや他の操作上の私たちにいくつかのヒントを与えることができ、相対ネイティブのタブキーを使用

 

ipythonを使用した後

私たちは、端末のテストでいくつかの小さなコードでipythonで達成することができる必要があることの後

 

.jupyterノートブックの3のインストールと使用

2つのインストールと起動モード

コマンドラインモード

インストール:
    PIP3はjupyterインストール
を開始:
    アクティブにしたいディレクトリを入力します:jupyterノート

このコマンドラインは、手動での追加的なデータ分析パッケージをインストールする必要があります。

します。https:最初の公式サイトを入力し//www.anaconda.com/
対応するバージョンをダウンロードすることを選択します

インストールプロセス赤い部分がチェックされていない、他のデフォルトの選択

 

アナコンダの方法を使用したソフトウェア

 長所:それは約200科学計算パッケージを中心に基本的なデータ解析パッケージが含まれています

1.anacondaの基礎特長

 

2.jupyterのノートブックは、エディタ機能します

 

新しいファイルのpython3を作成します。

ショートカット

ショートカットの
セルが緑色である:編集モードの
セルは青です:コマンドラインモード、モード入るESC
 1の動作を、現在のセルとセルは、Shift +で選択されて入力します
。2.ファイル名を指定して実行を現在のセルを、Ctrlキー+は入力
で3をセル上のユニットセルを追加、ESC + 以下4、ESC + B
 5セルを削除するには、ESC +はddを
スイッチングコード6および値下げ、ESC + M

これはPYファイル、彼サフィックスですipynbではないことに注意してください

 

 

おすすめ

転載: www.cnblogs.com/sxchen/p/11973032.html