(未完成)人工智能学习(22 机器学习:03-数据特征预处理:11_标准化总结以及缺失值处理)

数值型数据,进行标准缩放:1.归一化。2.标准化。当然,并不是所有的算法都需要进行归一化或者初始化,后面会进行讲解。

对于缺失值就不详细讲解了,一般使用pandas进行处理。那么缺失值一般怎么处理呢?一般有两种处理方式,填补(一般按列进行填补)或者删除。如果缺失值比较多的情况下,删除是要慎重考虑的,缺失值处理方式:
在这里插入图片描述
API介绍,
模块导入:
sklearn缺失值API: sklearn.preprocessing.Imputer
用法:

Imputer(missing_values='NaN', strategy='mean', axis=0)
完成缺失值插补

	Imputer.fit_transform(X,y)       
	X:numpy array格式的数据[n_samples,n_features]
	返回值:转换后的形状相同的array

猜你喜欢

转载自blog.csdn.net/weixin_43013761/article/details/89601078