数据归一化读书笔记

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/tiankong_/article/details/88173076

1.数据归一化的直观感受

直观来看,就是将数据按比例缩放,使之落入一个小的特定区间(0,1)或者(-1,1),目的是后续处理数据方便。

2.数据归一化的作用

(1)把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行比较和加权。

(2)在使用梯度下降的方法求解最优化问题时, 归一化/标准化后可以加快梯度下降的求解速度,即提升模型的收敛速度。
 

3.数据归一化的理解

归一化/标准化实质是一种线性变换,线性变换有很多良好的性质,这些性质决定了对数据改变后不会造成“失效”,反而能提高数据的表现,这些性质是归一化的前提。比如:线性变换不会改变原始数据的数值排序。

4.数据归一化的应用场景

(1)一些分类器需要计算样本之间的距离(如欧氏距离),例如KNN。如果一个特征值域范围非常大,那么距离计算就主要取决于这个特征,从而与实际情况相悖(比如这时实际情况是值域范围小的特征更重要)。

(2)去量纲场景:例如房子数量和收入,因为从业务层知道,这两者的重要性一样,所以把它们全部归一化。 这是从业务层面上作的处理。

猜你喜欢

转载自blog.csdn.net/tiankong_/article/details/88173076
今日推荐