Box-cox变换

Box-Cox变换

 Box和Cox于1964年提出了一种基于极大似然法的幂转换模型。Box-Cox幂分布族是一种十分有用的连续分布族。其转换模型为

(1) y ( λ ) = { y λ 1 λ , λ 0 l n y , λ = 0

 这里 λ 是一个待定的变换参数。对不同的 λ ,所做的变换自然不同,所以就是一个变换族。对因
变量的观察值 y 1 , y n ,应用上述变换,得到变换后的变量为:
(2) y ( λ ) = ( y 1 ( λ ) , , y n ( λ ) )

 这就是说,要求通过因变量的变换,使得变换后的 y ( λ ) 与自变量具有线性依托关系。因此,Box-Cox变换是通过参数的适当选择,达到对原来数据的“综合治理”,使其满足一个线性模型条件。

 对于 λ 值的选择,可以通过极大似然法来估计。首先,在一个经验范围内选择参数 λ 的值,然后使用下式计算:
(3) L ( λ ) = n 2 l n σ 2 + l n J ( λ , y )
 上式中,对于所有的 λ ,有:

(4) l n J ( λ , y ) = i = 1 n W r y i = i = 1 n y i λ 1

 对于每一个 λ 来说, σ 2 y ( λ ) 的极大似然估计,可通过式 ( 5 ) 计算得到:
(5) σ a 2 = 1 n i = 1 n ( y i ( λ ) y ¯ ( λ ) ) 2

 经推导可得到如下方程:
(6) L ( λ ) = n 2 l n [ i = 1 n ( y i ( λ ) y ¯ ( λ ) ) 2 n + ( λ 1 ) i = 1 n l n y i

 上式中,
y ¯ ( λ ) = 1 n i = 1 n y i ( λ )

 每一个 λ 对应的 λ ( λ ) 都可得到相应的 L ( λ ) 。由此可以描绘相应的 λ L ( λ ) 的关系图,从中我们可以得到相应的最优 λ ,使得 L ( λ ) 最大;该优化的 λ 对应了最优的转换模型。

这里写图片描述

猜你喜欢

转载自blog.csdn.net/weixin_41500849/article/details/80350119
Box