matlab标准化和反标准化——zscore

 

先说一下一个小疑问:

目前所了解的归一化概念有点模棱两可,目前可能有三种理解

假设矩阵A大小n*m,n代表样本数,m代表每一个样本的维度

①单独对每一列(全部样本的同一个属性)进行归一化

②单独对每一行(一个样本的所有的属性)进行归一化

③对整个矩阵A进行归一化

这三个理解都能达到所有数据变换到[0,1]的效果。

然后,正确的答案是:归一化是针对相同维度进行的,即①的理解。但是对于③,我认为也是可取的,也可以作为正确答案

举个例子,比如人的属性是颜色,身高,年龄。如果你对每一个人进行归一化,很可能把颜色归一化成一样的了,毕竟每一个人自己的几个属性的方差是不相同的,不排除存在这种可能,使得某种属性在归一化以后几乎相等,此时这种属性几乎就会失去作用了。但是对所有人的同一种属性进行归一化,即使也可能与其它维度是值相等了,但是这个属性并不会失去其作用

先来看自带函数zscore的使用

>> A=[1 2 3;4 5 6];
>> [B,A_mean,A_std]=zscore(A)

B =

   -0.7071   -0.7071   -0.7071
    0.7071    0.7071    0.7071


A_mean =

    2.5000    3.5000    4.5000


A_std =

    2.1213    2.1213    2.1213

>> 


其中A_mean代表A按列求均值,A_std代表每一个列向量的标准差。

接下来看看如何逐步求:

>> A=[ 1 2 3;4 5 6];
>> A_mean=mean(A,1);
>> A_std=std(A);
>> B=(A-repmat(A_mean,size(A,1),1))./repmat(A_std,size(A,1),1);
>> A_mean

A_mean =

    2.5000    3.5000    4.5000

>> A_std

A_std =

    2.1213    2.1213    2.1213

>> B

B =

   -0.7071   -0.7071   -0.7071
    0.7071    0.7071    0.7071


反标准化用到的是前面求到的两个参数:均值和标准差

B.*repmat(A_std,size(A,1),1)+repmat(A_mean,size(A,1),1)

ans =

     1     2     3
     4     5     6

所以在进行标准化和反标准化的时候,一定要记住均值和方差。

猜你喜欢

转载自blog.csdn.net/It_BeeCoder/article/details/84955863