191本の127エッセイを覚えて

cmdのコマンドでパンダのインストール後にインストール1. Pythonのインストール、およびインストール完成パンダはnumpyのをインストールしなくても行うことができます後、あなたは、numpyのを使用することができます

あなたはパンダとnumpyのを使用することができ、それはPCで使用することができます2.コマンドラインでは、PyCharm様々なライブラリが所有していない、あなたは、インポートする必要があります

3.データマイニングやデータ分析を行うことはパンダ、パンダnumpyのを必要とするPythonのは、ツール上で提供したライブラリの数が多いと、いくつかの標準データモデルが含まれて作成したデータ分析タスクを解決するためのツールをベースにhttp://blog.csdn.net/bylhjcsmmd/article/details/77530812?locationNum=9&fps=1をインポートする方法について説明し、大規模なデータ・ツールの効率的な運用のために必要な(おかげで、侵略は削除しました)

4.Jupyterは、共有ドキュメントに簡単に一つに説明テキスト、数式、すべてのコードとビジュアルコンテンツにユーザーを可能にするWebアプリケーションです迅速なデータ分析となっている、彼ができるので、マシンは不可欠なツールを学びますデータアナリストは、ユーザに全体の分析プロセスを説明することに注力します。オープンソースのWebアプリケーションであり、彼はあなたが、コードを記録したコードを実行し、結果を表示し、視覚化し、出力データは、データクリーニング、統計モデリング、構築、およびトレーニングのために使用することができる見ることができる環境を提供しましたなどの機械学習モデル、視覚的なデータは、プロジェクトのビルド時、Jupyterノートブックコードは別々のデータ単位で書き込まれ、スクリプトの実行の開始コードの必要性を排除し、コードのユーザーテストプロジェクトの特定のブロックを許可する、別のを実行し、Pythonの実行を許可されますそして等R、SQLのような他の言語、

5.データマイニング

(1)明確な目標:何も価値が掘るための明確なデータマイニング
データの収集:(2)データ収集
(3)データ探索を:データ探索は、手続きのデータ構造とルール分析することである
         ①データ品質分析を:欠損値の分析、外れ値解析、一貫性の分析
         ②データ解析機能:分布解析、比較解析、統計解析、周期分析、寄与解析
(4)データ処理:データ探索は私たち砂漠ことを教えてくれる誘導方向を与えることです推測に属する金の方向、しかし範囲は、さらに範囲を狭くする必要がある、まだ非常に大きく、データ処理は、私たちは再びスコープ絞り込むことができ
         クレンジング①データ:欠損値、処理外れ値、
         ②データ統合:エンティティを冗長な属性の識別、識別
         ③データ変換:韓国の装飾的な単純な変換、正規化、離散化、構成属性は、ウェーブレット変換
         ④データ法令を:法令属性数値法律の
目的のデータ処理は、データの品質を改善することで、メイクデータをより簡単にモデリング

(5)データモデリング:モデルは、大量のデータによる式は私たちが望む出力を入力することにより得られ、この式を推定するために、自然の機能、または式です。
          ①分類と予測:分類アルゴリズム、予測アルゴリズム、回帰分析、決定木、ニューラルネットワーク
          ②クラスタリング
          ③相関分析
          に基づくモード④
          ⑤外れ値の検出

 (6)評価モデル

 

 

 

 

 

 

 

 

おすすめ

転載: www.cnblogs.com/codekaterina/p/11945788.html