矩阵导数定义

矩阵求导:本质上只不过是多元函数求导,仅仅是把函数的自变量以及求导的结果排列成了矩阵的形式,方便表达与计算而已。

导数定义:

  1. 矩阵/向量值函数对实数的导数
  1. 求导结果与函数值同型(m×n矩阵求导结果也是m×n矩阵),且每个元素就是函数值的相应分量对自变量x求导,∂f∂xij=fij∂x。导数可以记做∇xF或∇'F
  1. 实值函数对矩阵/向量的导数
  1. 求导结果与自变量同型,且每个元素就是f对自变量的相应分量求导,∂f∂Xij=∂fxij。导数可以记做∇Xf
  2. 这是最重要的一个类别,机器学习里一般都是求标量损失函数对向量/矩阵参数的导数。
  1. δfi,jXfi,jδXi,j=tr((Xf)TδX)。向量值函数对向量的导数(雅克比矩阵)
  1. 函数 f: RnRm(n维到m维的映射),则导数fx是一个m×n维矩阵,且fxij=fixj。也可表示为∇xf
  1. 记:认为矩阵对向量、向量对矩阵、矩阵对矩阵的导数没有定义。

 

特殊例子:

       ∇xAx=A

       ∇xx=∇xIx=I

猜你喜欢

转载自blog.csdn.net/li6016265/article/details/86726864