本节在共轭转置的基础上介绍奇异值和奇异值分解。
谱分解
共轭转置
矩阵
A
的共轭转置
AH
(又称Hermite共轭、Hermite转置)定义为:
AH=(A¯)T=AT¯
酉矩阵
设
U∈Cn×n
阶复方阵,若
UHU=I
,则称
U
是酉矩阵。
Hermite矩阵
设
A∈Cn×n
,如果
AH=A
,那么
A
为Hermite矩阵;
如果
AH=−A
,则
A
为反Hermite矩阵。
Schur定理
任何一个
n
阶复矩阵都酉相似于一个上三角矩阵,则存在一个
n
阶酉矩阵
U
和一个
n
阶上三角矩阵
R
使得:
UHAU=R
其中
R
的对角元是
A
的特征值。
正规矩阵
设
A∈Cn×n
,如果:
AAH=AHA
则称
A
为正规矩阵。
可以证明,对角矩阵,Hermite矩阵,反Hermite矩阵,酉矩阵都是正规矩阵。
酉相似条件
n
阶矩阵
A
酉相似于一个对角矩阵的充分必要条件为
A
是正规矩阵。
因此,若
A
是
n
阶Hermite矩阵,则
A
必酉相似与实对角矩阵,即存在
n
阶酉矩阵
U
使得:
UHAU=Λ
因为
AH=A
,则
ΛH=Λ
,因此
Λ
是实对角矩阵。
谱分解
Hermite的谱分解式
由上文可知,若
A
为Hermite矩阵,则:
UHAU=Λ
奇异值分解
奇异值定义
设
A∈Cn×n
,如果存在非负实数
σ
和非零向量
u∈Cn,v∈Cm
,使得:
Au=σv,AHv=σu
则称
σ
为
A
的奇异值,
u
和
v
分别称为
A
对应于奇异值
σ
的右奇异向量和左奇异向量。
AHAu=σAHv=σ2u
因此
σ2
是
AHA
的特征值,也是
AAH
的特征值,而
u
和
v
分别是
AHA
和
AAH
对应于
σ2
的特征向量。
引理
设
A∈Cm×n
,则
rank(AHA)=rank(AAH)=rank(A)
设
A∈Cm×n
,则
-
AHA
与
AAH
的特征值均为非负实数
-
AHA
与
AAH
的非零特征值相同,并且非零特征值个数等于
rank(A)
定理
设
A
是正规矩阵,则
A
的奇异值为
A
的特征值的模。
设
A
是
m×n
矩阵,且
rank(A)=r
,则存在
m
阶酉矩阵
U
和
n
阶酉矩阵
V
使得:
UHAV=(∑000)
∑=diag(σ1,...,σr)
,且
σ1≥...≥σr>0
为矩阵
A
的奇异值
这个式子就被称为奇异值分解。
证明
易得
AHA
为Hermite矩阵,
AHA
的特征值
λ2≥λ2≥...>0
由Schur定理可得,存在
n
阶酉矩阵,使得:
UH(AHA)V=(∑2000)
将
V
分解为
V=(V1,V2),V1=Cn×r,V2=Cn×(n−r)
重写上式为:
AHA(V1,V2)=(V1,V2)(∑2000)
{AHAV1=V1∑2⇒VH1AHAV1=∑2⇒(AV1∑−1)H(AV1∑−1)=IAHAV2=0⇒VH2AHAV2=0⇒(AV2)H(AV2)=0
因此,
AV2=0,U1=AV1∑−1,
则
U1
是酉矩阵:
UH1U1=I
。
因此
U1
的前
r
列两两正交且为单位向量,将其扩充为
Cm
的标准正交基,
U2=(ur+1,...,um)
则
U=(U1,U2)
是
m
阶酉矩阵,
UH1U1=I,UH2U1=0
UH(AHA)V=UH(AV1,AV2)=(UH1UH2)(U1∑,0)=(∑2000)
因此:
A=U(∑2000)VH
V
为
AHA
的r个非零特征值对应的特征向量并单位化
U
为
AAH
的r个非零特征值对应的特征向量并单位化
思考
对于正定对称矩阵而言,奇异值分解和对角化相同
特征值分解必须要求
A
为方阵,而奇异值分解不需要
AHA
或
AAH
的特征值为
A
的奇异值的平方。
我们可以根据对
AHA
和
AAH
求特征值和特征向量,从而得到
V
、
U
、
∑
。