瑞利商
瑞利商
瑞利商
首先给出瑞利商的定义
R(A,x)=xTxxTAx
A 为一个
n∗n的对称矩阵。
它经常在一些统计问题中出现,因此在此记录其性质
我们记
A 的特征值以及对应的特征向量为
λ1,λ2,...,λn;v1,v2,...,vn;且有
λmin=λ1≤λ2≤...≤λn=λmax
则瑞利商的性质为:
xmaxR(A,x)=λn
xminR(A,x)=λ1
下面给出证明
由于
A 为对称矩阵,所以存在一个正交矩阵
U 使其特征值分解为
M=UΓUT
其中
Γ=diag(λ1,λ2,...,λn) 为只由
A 的特征值构成对角线值的矩阵。
如此,我们将初始形式转化为
R(A,x)=xTxxTUΓUTx=xTx(UTx)TΓ(UTx)
令
y=UTx
我们有
R(A,x)=xTxyTΓy=∑i=1n∣xi∣2∑i=1nλi∣yi∣2
由于
λi 的大小排序,可以得到:
λ1i=1∑n∣yi∣2≤i=1∑nλi∣yi∣2≤λni=1∑n∣yi∣2
于是:
∑i=1n∣xi∣2λ1i=1∑n∣yi∣2≤R(A,x)≤∑i=1n∣xi∣2λni=1∑n∣yi∣2
下面我们将证明
i=1∑n∣yi∣2=i=1∑n∣xi∣2
首先
yi=j=1∑nujixj
yiT=j=1∑nxjuij
⇒∣yi∣2=yiTyi=j=1∑nk=1∑nxjuijukixk
⇒i=1∑n∣yi∣2=yiTyi=j=1∑nk=1∑nxj(i=1∑nuijuki)xk
由于
U 为一个正交矩阵,所以
UTU=I,所以有
i=1∑nuijuki=Ijk
当
j̸=k时,
Ijk=0 ;当
j=k 时,
Ijk=1。
所以我们有
i=1∑n∣yi∣2=i=1∑n∣xi∣2
到此,我们有
λ1≤R(A,x)≤λn
成立
当
x=v1 时
R(A,x)=λ1 ,当
x=vn 时
R(A,x)=λn
且
R(A,x) 具有缩放不变的性质
x′=cx ,
R(A,x′)=x′Tx′x′TAx′=cxTxccxTAxc=R(A,x)
同时我们从拉格朗日乘子法的角度来求解:
不妨设
xTx=1 ,且我们在此条件下求解
R(A,x)=xTAx的极值
L(x,λ)=xTAx−λ(xTx−1)
对
x 求导,令其为
0
⇒Ax−λx=0
此即为
A 特征值的定义形式,所以容易得到与之前相同的结果
下面给出广义瑞利商的形式:
R(A,B,x)=xTBxxTAx
拉格朗日乘子法的角度:
Ax−λBx=0
⇒B−1Ax=λx
即有
R(A,B,x) 的极值在
B−1A 的特征向量上取得
或者将其转化成狭义瑞利商的形式
令
y=B21x ,我们有
R(A,B,x)=yTyyT(B−21)TA(B−21)y
即其取值范围为矩阵
(B−21)TAB−21
的特征值区间内
而且
B−1A 的特征值与
(B−21)TAB−21 是一样的,区别只是对应的特征向量差了一个相同的变换
NOTE:
对
(B−21)TA(B−21) 进一步进行特征值分解
VSVT
则
yT(B−21)TA(B−21)y=yTVSVTy=ZTSZ
即有
Z=VTy,且
S 为对角线是特征值的矩阵。
此时有
ZTSZ=i=1∑nλizi2,条件变为
ZTZ=yTy=1
所以也容易得到上述结果