清华大学公开课线性代数2——第3讲:奇异值分解

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/you1314520me/article/details/78857469

此博客停止更新迁移至SnailDove’s Blog查看本文点击此处

笔记源自:清华大学公开课:线性代数2——第3讲:奇异值分解

提示:如果文中图片看不清文字,请右键单击鼠标,选择在新窗口打开图片,然后放大图片(这边上传之前都是可以看清的,由于网页正文部分大小固定,因此图片被自动缩小以便适配网页),截图部分是课堂ppt老师随手的板书。

目录

前言

对角矩阵是我们最喜欢的一类矩阵,对能够相似于对角阵的矩阵能方便地计算其幂和指数,对不能相似于对角阵的方阵。上节课我们讨论了如何求出其尽可能简单的相似标准形及Jordan标准形以上讨论的都是方阵。那么对m乘n的矩阵我们如何来对它进行对角化呢?

线性代数中最重要的一类矩阵分解即奇异值分解,从而回答以上的问题。对角矩阵是我们最喜欢的一类矩阵,因为给定一个对角阵立即就可以得到它的特征值,行列式,幂和指数函数等等。对角矩阵的运算跟我们熟悉的数的运算有很多相似之处,而一个n阶的矩阵相似于对角阵当且仅当它存在着n个线性无关的特征向量。
preface_SVD
特别地,实对称矩阵一定会正交相似于对角阵,也就是说给你一个实对称矩阵,一定存在着正交矩阵 Q 把它的列向量记成 v 1 v n ,它能够满足 Q T A Q 等于 λ λ 是一个对角阵,它的对角元是 A 的特征值,那么其中 Q 的列向量 v i ,它是矩阵 A 的属于特征值, λ i 的特征向量,也就是满足 A v i 等于 λ i v i 。我们现在有个问题是说,如果对于 m × n 的一个矩阵,我们如何来”对角化”它。那么也就是说在什么意义上,我们能够尽可能地。把 m × n 的一个矩形的阵向对角阵靠拢,今天我们来讨论矩阵的奇异值分解它是线性代数应用中,最重要的一类矩阵分解。

A A T A T A 的特性

A A T A T A 的特征值

1st_property_of_AAT

A A T A T A 非0特征值集合

2nd_property_of_AAT

A T A A A T 的特征向量

orthonormal_eigenvectors_of_AAT

u i := A v i σ i R m ( 1 i r ) ,则 A A T u i = A ( A T A v i σ i ) = A A T A v i σ i = A σ i 2 v i σ i = σ i 2 A v i σ i = σ i 2 u i ,得出: A A T u i = σ i 2 u i 。又因为: u i T u j = A v i T σ i A v j σ j = v i T ( A T A v j ) σ i σ j = σ j 2 v i T v j σ i σ j = σ j σ i v i T v j u i T u j = { 0 , i j 1 , i = j 故: { u i | 1 i r } A A T 的单位正交特征向量。

根据假设( v 1 , . . . , v n A T A 的单位交基, σ 1 2 , . . . , σ n 2 A A T 的特征值)得: A T A v i = σ i 2 v i ( 1 i r ) v i T A T A v i = v i T σ i 2 v i = σ i 2 v i T v i | | A v i | | 2 = σ i 2 | A v i | = σ i

A A T 得出SVD

( 1 ) u i := A v i σ i R m ( 1 i r ) A v i = σ i u i ( 2 ) A T A v i = σ i 2 v i , ( i i r ) A T A v i σ i = σ i v i A T u i = σ i v i

由上式子得: U A 列空间的一组单位正交基, V A T 的列空间的一组单位正交基。 σ i A v i 的长度,计 ( σ 1 . . . σ r ) Σ ,得: A m × n V n × r = U m × r Σ r × r A m × n = U m × r Σ r × r V 1 r × n = U m × r Σ r × r V T r × n

向量形式: A = i = 1 r σ i u i v i T

get_svd_from_AAT

SVD形式

formula_svd

例题

example_svd

u 3 两种方法:

方法1: A A T u 3 = ( 1 0 0 1 1 1 ) ( 1 0 1 0 1 1 ) u 3 = ( 1 0 1 0 1 1 1 1 2 ) u 3 = 0 u 3 u 3 = 1 3 ( 1 1 1 )

方法2: u j := ( x y z ) , i = 1 r = 3 u i u j = 0 ( i j ) , | | u j | | 2 = 1 u j = 3 = 1 3 ( 1 1 1 )

svd几何意义

example_geometry_svd
geometry_svd

svd应用

svd与矩阵的四个基本子空间

4_subspaces_svd

svd与图像压缩

img_compression_by_svd

奇异值与特征值关系

singular_values_and_eigenvalues

奇异值与奇异矩阵

singular_values

猜你喜欢

转载自blog.csdn.net/you1314520me/article/details/78857469