Matrix derivatives(矩阵求导)

11.对于一个函数f:为一个m*n矩阵到实数的映射。定义f对于A的导数为:


Af(A)也是一个m*n的矩阵,其中的元素(i,j)为∂f/∂Aij。




22.同样,引入迹(trace)的概念。

对一个n*n的矩阵A,迹定义为矩阵A的对角线元素之和。

如果a是一个实数(i.e., a 1-by-1 matrix),则tr a=a。迹的性质如下,


33.给定一个训练集,定义X是一个m*n的矩阵,其每行的值为训练集的输入值(m为训练集的样例数)

扫描二维码关注公众号,回复: 1770304 查看本文章

向量y是一个m*1的向量,对应训练集中每个Xi的目标值

因为所以很容易得到如下的定义,


又已知,得


因而为了得到最小J,由迹的性质的2、3可得5如下

44.所以,得到使得代价函数最小的













#

猜你喜欢

转载自blog.csdn.net/boahock/article/details/78698020