线性代数笔记15:SVD分解

本节在共轭转置的基础上介绍奇异值和奇异值分解。

谱分解

共轭转置

矩阵 A 的共轭转置 A H (又称Hermite共轭、Hermite转置)定义为:

A H = ( A ¯ ) T = A T ¯

酉矩阵

U C n × n 阶复方阵,若 U H U = I ,则称 U 是酉矩阵。

Hermite矩阵

A C n × n ,如果 A H = A ,那么 A 为Hermite矩阵;

如果 A H = A ,则 A 为反Hermite矩阵。

Schur定理

任何一个 n 阶复矩阵都酉相似于一个上三角矩阵,则存在一个 n 阶酉矩阵 U 和一个 n 阶上三角矩阵 R 使得:

U H A U = R

其中 R 的对角元是 A 的特征值。

正规矩阵

A C n × n ,如果:

A A H = A H A

则称 A 为正规矩阵。

可以证明,对角矩阵,Hermite矩阵,反Hermite矩阵,酉矩阵都是正规矩阵。

酉相似条件

n 阶矩阵 A 酉相似于一个对角矩阵的充分必要条件为 A 是正规矩阵。

因此,若 A n 阶Hermite矩阵,则 A 必酉相似与实对角矩阵,即存在 n 阶酉矩阵 U 使得:

U H A U = Λ

因为 A H = A ,则 Λ H = Λ ,因此 Λ 是实对角矩阵。

谱分解

Hermite的谱分解式

由上文可知,若 A 为Hermite矩阵,则:

U H A U = Λ

奇异值分解

奇异值定义

A C n × n ,如果存在非负实数 σ 和非零向量 u C n , v C m ,使得:

A u = σ v , A H v = σ u

则称 σ A 的奇异值, u v 分别称为 A 对应于奇异值 σ 的右奇异向量和左奇异向量。

A H A u = σ A H v = σ 2 u

因此 σ 2 A H A 的特征值,也是 A A H 的特征值,而 u v 分别是 A H A A A H 对应于 σ 2 的特征向量。

引理

  1. A C m × n ,则

    r a n k ( A H A ) = r a n k ( A A H ) = r a n k ( A )

  2. A C m × n ,则

    • A H A A A H 的特征值均为非负实数
    • A H A A A H 的非零特征值相同,并且非零特征值个数等于 r a n k ( A )

定理

  1. A 是正规矩阵,则 A 的奇异值为 A 的特征值的模。

  2. A m × n 矩阵,且 r a n k ( A ) = r ,则存在 m 阶酉矩阵 U n 阶酉矩阵 V 使得:

    U H A V = ( 0 0 0 )

    = d i a g ( σ 1 , . . . , σ r ) ,且 σ 1 . . . σ r > 0 为矩阵 A 的奇异值

    这个式子就被称为奇异值分解。

证明

易得 A H A 为Hermite矩阵, A H A 的特征值 λ 2 λ 2 . . . > 0

由Schur定理可得,存在 n 阶酉矩阵,使得:

U H ( A H A ) V = ( 2 0 0 0 )

V 分解为 V = ( V 1 , V 2 ) , V 1 = C n × r , V 2 = C n × ( n r )

重写上式为:

A H A ( V 1 , V 2 ) = ( V 1 , V 2 ) ( 2 0 0 0 )

{ A H A V 1 = V 1 2 V 1 H A H A V 1 = 2 ( A V 1 1 ) H ( A V 1 1 ) = I A H A V 2 = 0 V 2 H A H A V 2 = 0 ( A V 2 ) H ( A V 2 ) = 0

因此, A V 2 = 0 , U 1 = A V 1 1 , U 1 是酉矩阵: U 1 H U 1 = I

因此 U 1 的前 r 列两两正交且为单位向量,将其扩充为 C m 的标准正交基, U 2 = ( u r + 1 , . . . , u m )

U = ( U 1 , U 2 ) m 阶酉矩阵, U 1 H U 1 = I U 2 H U 1 = 0

U H ( A H A ) V = U H ( A V 1 , A V 2 ) = ( U 1 H U 2 H ) ( U 1 , 0 ) = ( 2 0 0 0 )

因此:

A = U ( 2 0 0 0 ) V H

V A H A 的r个非零特征值对应的特征向量并单位化

U A A H 的r个非零特征值对应的特征向量并单位化

思考

  1. 对于正定对称矩阵而言,奇异值分解和对角化相同

  2. 特征值分解必须要求 A 为方阵,而奇异值分解不需要

  3. A H A A A H 的特征值为 A 的奇异值的平方。

  4. 我们可以根据对 A H A A A H 求特征值和特征向量,从而得到 V U

猜你喜欢

转载自blog.csdn.net/crazy_scott/article/details/80068837