アイリスプラントデータ(分類) - 前のブログは、機械学習、機械学習、記録のための前処理データのデプロイ開発環境を書いて、scikit-学ぶ内蔵のアイリスデータを使用しています。割り当てをロードし、印刷する方法を含みます
まず、ある学習scikit何を教えて:
-
scikit学習Python言語に基づいて機械学習ツールです。
-
シンプルで効率的なデータマイニングやデータ分析ツール
-
様々な環境で再利用するすべての人に利用可能
-
numpyの、scipyのダウンロードとmatplotlibのに基づいて、
第二に、虹彩は、データセットの多変量解析のクラスです。
-
150は、3種類のレコードが含まれているために、各レコードには、4つの属性があります。
-
萼は長さ、幅がく、花びらの長さ、花弁の幅です。
-
ホイ(Setosa、Versicolour、virginicaの)三つのカテゴリーの種類属しアイリスこれらの4つのプロパティによって予測することができます。
次のステップは、jupyter、虹彩データに前処理されます。
まず、アナコンダを開いて、jupyter、新しいAののpython3をクリックしてください。
虹彩データセットを使用してLoad_irisローディング方法:
-
sklearnのインポートデータセットから
-
アイリス= datasets.load_iris()
iris.data印刷出力値は、各レコードには、前述の4つのプロパティが含まれている、複数のレコードを見ることができます。
虹彩のいくつかの方法
-
iris.data//は、4つのプロパティを費やし
-
各カラム名iris.feature_names //出力
-
デジタル出力カテゴリ0/1/2で表現iris.target//
-
iris.target_name //出力カテゴリ名
-
タイプ()確認データ型に
-
iris.data.shap //確認寸法
次の操作を行います
あなたが見ることができ、iris.dataとiris.target属性データと結果のデータ型はnumpyのです
割り当て:
X = iris.data
Y = iris.data