python sklearn预处理方法

1. 标准化(scale)

标准化目的是去均值。变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除以标准差。

import numpy as np
from sklearn import preprocessing

in_data = np.array([[5.1, -2.9, 3.3],[-1.2, 7.8, -6.1]])

data_scale = preprocessing.scale(in_data)

2.最小-最大规范化(Min_Max_Scaler)

最小-最大规范化对原始数据进行线性变换,变换到[0,1]区间

3.规范化(Normalization)

规范化是将不同变化范围的值映射到相同的固定范围,常见的是[0,1],此时也称为归一化。

将每个样本变换成unit norm。常见的L1 norm和L2 norm

L2 norm变换后每个样本的各维特征的平方和为1

L1 norm变换后每个样本的各维特征的绝对值和为1

preprocessing.normalize(in_data, norm='l2')
preprocessing.normalize(in_data, norm='l1')

参考:

sklearn中常用数据预处理方法

人工智能:python代码实现

猜你喜欢

转载自blog.csdn.net/zilong230905/article/details/83956244
今日推荐