清华大学公开课线性代数2——第1讲:正定矩阵

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/you1314520me/article/details/78856322

此博客停止更新迁移至SnailDove’s Blog查看本文点击 此处 清华大学线性代数2笔记汇总:线性代数总结
笔记源自:清华大学公开课:线性代数2——第1讲:正定矩阵,涉及:正定矩阵、二次型、合同、惯性定理、Hessian

**提示:**如果文中图片看不清文字,请右键单击鼠标,选择在新窗口打开图片,然后放大图片(这边上传之前都是可以看清的,由于网页正文部分大小固定,因此图片被自动缩小以便适配网页),截图部分是课堂ppt老师随手的板书。

引言

正定矩阵的意义

矩阵特征值的正负在求解微分方程和差分方程时,会影响解是否收敛,例如上图如果 λ i < 0 \lambda_i < 0 那么 e λ i t e^{\lambda_i t} 随着 t , e λ i t 0 t\rightarrow \infty, e^{\lambda_it}\rightarrow0

主子式

正定矩阵的意义

1st_example_of_principal_minor
2nd_example_of_principal_minor.png

实对称矩阵A正定的充要条件

下列6项条件,满足任意一项即可判定实对称矩阵 A A 为正定矩阵:

prerequisites_of_positive_definite_matrix.png

###证明

( 1 ) ( 2 ) : (1)\Rightarrow(2): 对实对称矩阵 A A ,那么存在正交阵 Q Q ,使得 A Q = Q Λ A = Q Λ Q T AQ=Q\Lambda \rightarrow A=Q\Lambda Q^T ,其中 Λ = d i a g ( λ 1 ,   . . .   , λ n ) \Lambda=diag(\lambda_1,\,...\,,\lambda_n) 。于是对于任意非零向量 x x ,有 x T A x = x T Q Λ Q T x = y T Λ y = λ 1 y 1 2 +   . . .   + λ n y n 2 > 0 , y = Q T x = ( y 1 ,   . . .   , y n ) 0 x^TAx=x^TQ\Lambda Q^Tx=y^T \Lambda y=\lambda_1 {y_1}^2+\,...\,+\lambda_n {y_n}^2>0, y=Q^Tx=(y_1,\,...\,,y_n) \ne\vec{0}

( 2 ) ( 1 ) : (2)\Rightarrow(1): A x = λ x ( x 0 ) Ax=\lambda x(x\ne0) 0 < x T A x = x T λ x = λ x 2 0<x^TAx=x^T\lambda x=\lambda||x||^2 ,因此所有 λ i > 0 \lambda_i>0

( 2 ) ( 3 ) : (2)\Rightarrow(3): 由于行列式等于矩阵特征值的乘积,故 ( 2 ) ( 1 ) ( 3 ) d e t A = λ 1   . . .   λ n > 0 (2)\Rightarrow(1)\Rightarrow (3)det A=\lambda_1\,...\,\lambda_n>0

( 2 )   0 < ( x k T 0 ) ( A k ) ( x k 0 ) = x k T A k x k = x k T ( λ 1 . . . λ k ) x ,   ( 1 k n ) ( 1 ) λ i > 0 , ( 1 i k , 1 k n ) ( 3 ) d e t A k > 0 , ( 1 k n ) (2)\, 0<\begin{pmatrix}x_k^T&0\end{pmatrix} \begin{pmatrix}A_k&*\\*&*\end{pmatrix}\begin{pmatrix}x_k\\0\end{pmatrix}={x_k}^T A_k x_k = {x_k}^T \begin{pmatrix} \lambda_1&\\&.\\&&. \\&&&. \\ &&&&\lambda_k \end{pmatrix} x,\, (1 \le k \le n) \\\Rightarrow (1) \lambda_i > 0,(1\le i \le k, 1 \le k \le n) \Rightarrow (3) detA_k>0, (1 \le k \le n)

( 3 ) ( 4 ) (3)\Rightarrow(4) :顺序主子式与主元有直接联系,因为第k个主元 d k = d e t A k d e t A k 1 d_k={det A_k \over det A_{k-1}} ,所以 ( 3 ) ( 4 )   d k > 0 (3) \Rightarrow (4)\,d_k > 0 ,其中 A k A_k 是第 k k 个顺序主子矩阵(the k-th leading principal sub-matrix)。

( 4 ) ( 2 ) (4) \Rightarrow (2) :由对称矩阵的Gauss消元法得 A = L D L T A=LDL^T 且对角阵 D = d i a g ( d 1 ,   . . .   d n ) D=diag(d_1,\,...\,d_n) 的对角元为A的主元, L L 是下三角矩阵, L T L^T 是上三角矩阵,而且根据分解结果知道 L L 的主对角线上全元素为1,也即 L T L^T 的主元全为1,即 L T L^T 行列式为1且是方阵,那么这俩都可逆。因为 ( 4 ) : d 1 ,   . . .   , d n (4):d_1,\,...\,,d_n 大于0,那么到: x 0 y = L T x 0 x T A x = x T L D L T x = y T D y = d 1 y 1 2 + . . . + d n y n 2 > 0 x\ne 0\Rightarrow y=L^Tx\ne 0\Rightarrow x^TAx=x^TLDL^Tx=y^TDy=d_1y_1^2+...+d_ny_n^2>0

可逆矩阵齐次方程只有零解

( 2 ) ( 5 ) (2)\Rightarrow(5) A = L D L T = L D D L T = ( D L T ) T ( D L T ) A=LDL^T=L\sqrt{D}\sqrt{D}L^T=(\sqrt{D}L^T)^T(\sqrt{D}L^T) ,此时可取 R = D L T R=\sqrt{D}L^T ,因为 D , L T \sqrt{D}, L^T 都可逆且都是方阵,由于 ( 2 ) ( 3 ) ( 4 ) (2)\Rightarrow(3)\Rightarrow(4) ,因此 D > 0 \sqrt{D}>0 ,且有上面推导得 L T > 0 |L^T|>0 , 可逆矩阵乘积还是可逆。

根据行列式性质:$ |A||B|=|AB| , , 当 A,B$ 均可逆,那么 A > 0 , B > 0 A B > 0 |A|>0, |B|>0 \rightarrow |AB|>0 , 所以 A B AB 也可逆。

或者: A = Q Λ Q T = Q Λ Λ Q T = ( Λ Q T ) ( Λ Q T ) A=Q\Lambda Q^T=Q\sqrt{\Lambda}\sqrt{\Lambda}Q^T=(\sqrt{\Lambda}Q^T)(\sqrt{\Lambda}Q^T) ,此时可取 R = Λ Q T R=\sqrt{\Lambda}Q^T ,同理可得。

( 5 ) ( 2 ) (5)\Rightarrow(2) A = R T R x T A x = x T R T R x = ( R x ) T R x = R x 2 0 A=R^TR\Rightarrow x^TAx=x^TR^TRx=(Rx)^TRx=||Rx||^2 \ge 0 R R 是列满秩,除了 x = 0 x=0 之外,其余 x T A x = R x 2 > 0 x^TAx=||Rx||^2 > 0 ,即 ( 5 ) ( 2 ) (5)\Rightarrow(2)

( 6 ) ( 2 ) (6)\Leftarrow\Rightarrow(2) :

how_to_check_positive_definite_matrix

####典型例子

1st_method_of_check_postive_definite
2nd_method_of_check_postive_definite
3rd_method_of_check_postive_definite
4th_method_of_check_postive_definite
5th_method_of_check_postive_definite
6th_method_of_check_postive_definite
7th_method_of_check_postive_definite

正定矩阵的性质

###如果 A , B A,B 是正定矩阵,那么 A + B A+B 也是正定矩阵

1st_property_of_positive_definite_matrix

###如果 A A 为正定矩阵,则存在矩阵 C C ,满足 A = C 2 A=C^2

2nd_property_of_positive_definite_matrix

###如果 A A 为正定矩阵,则矩阵 A A 的幂也是正定的

3rd_property_of_positive_definite_matrix

###如果 A A 为正定矩阵,矩阵 C C ,那么 B = C T A C B=C^TAC 也是正定的

4th_property_of_positive_definite_matrix

注:其实B称为A的合同矩阵

半正定矩阵的判别条件

how_to_check_semi-positive_definite_matrix

##二次型

###定义

definition_of_quadratic_form

注意:这里证明里面 A A T 2 {A-A^T\over 2} 是反对称矩阵,利用反对称矩阵性质,所以 x T A A T 2 x = 0 x^T{A-A^T\over 2}x=0 。二次型与判定正定矩阵的第二条准则密切相关。

###例子

1st_example_of_quadratic_form

对角形

quadratic_form_to_diagonal_form

####二次型化成对角形
example_of_quadratic_form_to_diagonal_form

注:由于实对称矩阵 A A 可以与二次型一一对应,因此,可以借助实对称矩阵研究二次型。

###主轴定理principal axis theorem

principal_axis_theorem

有心二次型central_conic

central_conic

三维空间中的二次曲面-6类基本的二次曲面

R 3 R^3 种的二次曲面的方程形如:
a 11 x 2 + a 22 y 2 + a 33 z 2 + 2 a 12 x y + 2 a 13 x z + 2 a 23 y z + b 1 x + b 2 y + b 3 z + c = 0 a_{11}x^2+a_{22}y^2+a_{33}z^2+2a_{12}xy+2a_{13}xz+2a_{23}yz+b_{1}x+b_{2}y+b_{3}z+c=0 .

ellisoid

hyperboloid_of_one_sheet

hyperboloid_of_two_sheets

elliptic_cone

elliptic_paraboloid

hyperbolic_paraboloid

注:由于二次型可以与实对称对称矩阵一一对应,二次型里面又包括二次曲面,所以实对称矩阵可以跟二次曲面对应起来。

二次型的分类

classification_of_quadratic_form

example_of_classification_of_quadratic_form

###二次型与特征值

relation_between_eigenvalues_and_eigenvectors

二次型的一个应用——求二次型的几何形状

get_the_geometric_shape_of_quadratic_form

把二次型的部分去化成对角形的标准型,相应的这个一次项也作了变换,于是再做配方然后去跟基本的形状做比较得出这个曲面的几何形状,这是二次型的一个应用。

合同congruent

####前言

preface_of_congruent

注:非退化矩阵即满秩矩阵

定义

definition_of_congruent

例子

example_of_congruent

主轴定理与合同

congruent_and_prioncipal_axis_theorem

####合同的性质

properties_of_congruent

证明:
矩阵 A A 左乘可逆矩阵 C T C^T 相当于做初等行变换,右乘以可逆矩阵 C C 相当于做初等列变换,因此根据消元法知道并不改变矩阵 A A 的秩。对称性保持证明在于二次型定义可以看到。

1.利用初等变换不改变矩阵的秩,因为可逆矩阵可以表示为初等矩阵的乘积,而A乘初等矩阵相当于对A作初等变换,所以A的秩不变-。这个方法包括了可逆矩阵左乘A,右乘A,或是左右同时乘A
2.利用 r(AB)

###惯性定理Sylvester’s law of inertia的证明

1st_proof_Sylvester's_law_of_inertia
2nd_proof_Sylvester's_law_of_inertia
###惯性定理的应用

application_of_Sylvester's_law_of_inertia

###正负定矩阵在函数极值中的应用

以二元函数 f ( x , y ) f(x,y) 为例:设 ( x 0 , y 0 ) (x_0,y_0) 是二元函数 f ( x , y ) f(x,y) 的一个稳定点,即: f x ( x 0 , y 0 ) = f y ( x 0 , y 0 ) = 0 \frac{\partial f}{\partial x}(x_0,y_0)={\partial{f}\over \partial{y}}(x_0,y_0)=0 。如果 f ( x , y ) f(x,y) ( x 0 , y 0 ) (x_0,y_0) 的领域里有三阶偏导数,则 f ( x , y ) f(x,y) ( x 0 , y 0 ) (x_0,y_0) 可展开成Talor级数:

application_of_minimum_by_positive_definite_matrix

####黑塞Hessian矩阵

黑塞矩阵(Hessian Matrix),又译作海森矩阵、海瑟矩阵、海塞矩阵等,是一个多元函数的二阶偏导数构成的方阵,描述了函数的局部曲率。黑塞矩阵最早于19世纪由德国数学家Ludwig Otto Hesse提出,并以其名字命名。黑塞矩阵常用于牛顿法解决优化问题,利用黑塞矩阵可判定多元函数的极值问题。在工程实际问题的优化设计中,所列的目标函数往往很复杂,为了使问题简化,常常将目标函数在某点邻域展开成泰勒多项式来逼近原函数,此时函数在某点泰勒展开式的矩阵形式中会涉及到黑塞矩阵。

hessian_matrix
hessian_matrix_of_quadratic_form

5th_example_application_of_minimum_by_positive_definite_matrix

1st_example_application_of_minimum_by_positive_definite_matrix

2nd_example_application_of_minimum_by_positive_definite_matrix

3rd_example_application_of_minimum_by_positive_definite_matrix

4th_example_application_of_minimum_by_positive_definite_matrix

猜你喜欢

转载自blog.csdn.net/you1314520me/article/details/78856322