sklearnデータ収集と前処理

sklearn

キーワード

sklearn、データセット、データフレーム、LOAD_ *

前処理MinMaxScaler、スケーラー、フィット感変換、データ、ターゲット

sklearnデータ収集

[1]:
インポートsklearnの

[2] 
。sklearn __VERSION__ 

IN [6]:
インポートNP AS numpyの
 インポートPD AS PANDAS
 インポートPLT AS matplotlib.pyplot 
。Get_ipython()run_line_magic(' matplotlibの'' インライン' jupyterビジュアルプレゼンテーショングラフィックス
から sklearn インポートデータセット     データセットsklearnからインポート

IRIS = datasets.load_iris() 


で[10]:
IRIS 
iris.data 
IRIS [ 'ターゲット' ] 


:IN [17]。 データフレームを使用して、単純な視覚的分析を行う 
DF = pd.DataFrame(iris.data、列= iris.feature_names)    テーブルである 
DF [ ' 標的' ] = iris.target     ヘッダフィールドがキーである 
(figsize =(12 ,. 8)である)df.plot

 

データの前処理

正規化されたデータ:調整値のそれぞれの大きさの次の順番に

sklearnのインポート#のデータ標準化sklearn前処理であります

データの正規化

二値化データ

非線形変換

データ符号化機能

欠損値の処理

 

データ標準化

キーワード

前処理、MinMaxScaler、スケーラー、フィット感、変換、データ、ターゲット

sklearn インポート前処理
スケーラ = preprocessing.MinMaxScaler()    スケーラ:スケーラ   MinMaxScaler直線0,1の間にサンプルの特徴値をスケーリング 
scaler.fit(iris.data)    ファーストフィット 
データ= scaler.transform(IRIS。データ)     別のコンボfit_transformのように記述することができる変換 
ターゲット= iris.target

 

おすすめ

転載: www.cnblogs.com/draven123/p/11408086.html