Hessian矩阵正定与函数凹凸性的关系

1. 从矩阵变换的角度

首先半正定矩阵定义为: X^TMX \geq 0
其中X 是向量,M 是变换矩阵

我们换一个思路看这个问题,矩阵变换中,MX代表对向量 X进行变换,我们假设变换后的向量为Y,记做Y=MX。于是半正定矩阵可以写成:
X^TY \geq 0

这个是不是很熟悉呢? 他是两个向量的内积。 同时我们也有公式:

cos(\theta) = \frac{X^TY}{||X||* ||Y||}

||X||, ||Y||代表向量 X,Y的长度,\theta是他们之间的夹角。 于是半正定矩阵意味着cos(\theta)\geq 0, 这下明白了么?

正定、半正定矩阵的直觉代表一个向量经过它的变化后的向量与其本身的夹角小于等于90度。

2.考虑矩阵的特征值。
若所有特征值均不小于零,则称为半正定。

若所有特征值均大于零,则称为正定。

3. 黑塞矩阵的正定性

Hessian矩阵的正定性在判断优化算法可行性时非常有用,简单地说,黑塞矩阵正定,则

1. 函数的二阶偏导数恒 > 0

2. 函数的变化率(斜率)即一阶导数始终处于递增状态

3. 函数为凸

因此,在诸如牛顿法等梯度方法中,使用黑塞矩阵的正定性可以非常便捷的判断函数是否有凸性,也就是是否可收敛到局部/全局的最优解。

原文链接:https://www.zhihu.com/question/20822481

https://blog.csdn.net/qq_39521554/article/details/78895869

猜你喜欢

转载自blog.csdn.net/akenseren/article/details/80416828