正規化されたデータの前処理

MATLAB関数を直接呼び出すことができmapminmax
例:
%リード行列A
A =関数xlsread( 'D:の.xlsxファイル名');
%正規化行列
F = mapminmax(A)
の%出力正規化行列F
xlswrite ( 'D:新しいファイル名'、F)

https://blog.csdn.net/weixin_38706928/article/details/80329563
コードとのリンク

ディレクトリ

正規化されました

背景のデータの正規化

MinMaxScaler:[0,1]に正規化

MaxAbsScaler:[-1,1]に正規化

標準化

平均、分散のスケールに

正規化された
データは、背景を正規化
に集まっなって、私たちは当初の計画は、2次元のポイントに広がるべきである作り、多くの場合、特にデータの影響によって影響されるクラスタリングの効果を発見した前に、クラスター分析を行っていますラインのポイントは、驚くべきことに、クラスタリング効果は確かに理想的ではありません。

左:散布図分析のクラスタプロパティのすべてのデータの後に、

右:の一つは、契約金額のためのものであり、正規化されたデータのプロットを散乱しません。

正規化方法は、1つのスカラーなり、無次元式は無次元表現になっている、一つは(0,1)との間の分数ターン数であり、2つの形式があります。その中で、マイクロ波中、すなわち、回路解析、信号システム、電磁波の送信、等の物理者が熟知しているであろう一般的です。そして、私たち普通の日常のデータアナリストと同様に、以下のような状況正規化された無次元式を満たすために必要とされ、そのためだけ[0,1]に正規化された状況を説明します。

正規化されたデータは、一般的に[0,1]にマッピングされ、しかし[-1、1]に正規化がされている、2つのケースがMaxAbsScaler MinMaxScalerやPythonの方法で実現することができます。

MinMaxScaler:[0,1]に正規化
の原則

原則として、我々は実用的なアプリケーションに合わせてより多くのである正規化演算を、やって各列のMinMaxScalerデフォルトの方法を意味軸= 0を、気づきました。

例:[0,1]に正規化されたデータを

sklearnインポート前処理から
NPとしてインポートnumpyの

X = np.array([3、-1。、2、613]、
[2、0、0、232]、
[0、1、-1、113]、
[ 1、2、-3、489]])

= preprocessing.MinMaxScalerのmin_max_scaler()
x_minmax = min_max_scaler.fit_transform(X)
プリント(x_minmax)
結果:

[[1。0 1 1]
[0.66666667 0.33333333 0.6 0.238]
[0。0.66666667 0.4 0]
[0.33333333 1. 0 0.752]

新しいテスト・データが入ってくる場合は、我々はその後、同じ変換を行い、元のテストデータの末尾に新しいデータを追加したいです

sklearnインポート前処理から
、PDなどの輸入パンダ

min_max_scaler = preprocessing.MinMaxScaler()

= X([3、-1。、2、613]、
[2、0の0ザ、ザ、232]の
0ザ、1の[-1。、113]、
[1、 2、-3、489])は、元のデータ#の

Y = [7、1、。 #-4、987] 新たなテストデータ
x.append(Y)#1、X、Yの終わりに
プリント( 'X:\ N-'、X)
x_minmax = min_max_scaler.fit_transform (X)
を印刷( 'x_minmax:\ N-'、x_minmax)
結果:

X:
[3.0、-1.0、2.0、613.0]、[2.0、0.0、0.0、232]、[0.0、1.0、-1.0、113]、[1.0、2.0、-3.0、489]、[7.0、1.0 、-4.0、987]
x_minmax:
0. 1の[0.42857143 0.57208238]
[0.28571429 0.33333333 0.66666667 0.13615561]
0 0.5 0 0.66666667の[]
[0.14285714 1 0.16666667 0.43020595]
[0の0.66666667 1 1]
あたりこれは、最大値が1となる、最小値が0となっています。

MaxAbsScaler:[-1,1]に正規化
同様の原理とMinMaxScaler、

sklearnインポート前処理から
NPとしてインポートnumpyの

np.array = X([3、-1。、2、613]、
[2、0ザの、0ザ、232]の、
[0ザ、1、-1、113]の、
[ 。1、2、-3、489])
max_abs_scaler = preprocessing.MaxAbsScaler()
x_train_maxsbs = max_abs_scaler.fit_transform(X)
x_train_maxsbsの
結果:

アレイ([1、-0.5、0.66666667、1]、
[0.66666667、0のザ、0ザ、0.37846656]の
0ザの【、0.5、-0.33333333、0.18433931]、
[0.33333333、1、-1、 0.79771615]])
新しいテストデータの場合、元のテーブルが持つ正規化されます。

sklearnインポート前処理から
、PDなどの輸入パンダ

max_abs_scaler = preprocessing.MaxAbsScaler()

= X([3、-1。、2、613]、
[2、0の0ザ、ザ、232]の
0ザ、1の[-1。、113]、
[1、 2、-3、489])は、元のデータ#の

Y = [5、1、。 #-4、888] 新たなテストデータ
x.append(Y)
の印刷( 'X:\ N-'、X)
x_train_maxsbs = max_abs_scaler.fit_transform(X)
プリント(「x_train_maxsbs。 \ n」は、x_train_maxsbs)
結果:

X:
[3.0、-1.0、2.0、613.0]、[2.0、0.0、0.0、232]、[0.0、1.0、-1.0、113]、[1.0、2.0、-3.0、489]、[5.0、1.0 、-4.0、888]
x_train_maxsbs:
[0.6 -0.5 0.5 0.69031532]
[0.4 0 0 0.26126126]
[0 0.5 -0.25 0.12725225]
[0.2 1 -0.75 0.55067568]
[1 0.5 -1。1]]


著者:黄はテクニカル分析パッケージに従事
CSDN:出典
元:https://blog.csdn.net/weixin_40683253/article/details/81508321
著作権:この記事を再現ブロガーのオリジナルの記事、である、ボーエンのリンクを添付してください!

おすすめ

転載: blog.csdn.net/JiangLongShen/article/details/90443275