机器学习入门(三)之----线性回归番外篇(矩阵求导)

机器学习入门(三)之----线性回归番外篇(矩阵求导)

笑容发自真心

现到脸上却变得虚假

所以我也就不用龇牙

声音发自灵魂

走到喉咙却变得含混

所以我不说话

求解线性回归问题,最优参数的第二种方法是对损失函数直接求导,并令其导数为零。这就需要对矩阵求导。下面我们先来介绍矩阵求导。大跃进喽。。。。

矩阵导数定义

一个矩阵函数就是将一个\(m \times n\) 矩阵\(A\) 映射为一个数的函数,即\(f : \mathbb{R}^{m \times n} \mapsto \mathbb{R}\)
关于一个矩阵求导,得到的还是和这个矩阵具在一样大小的矩阵。并定义这个矩阵函数对矩阵\(A\) 导数的$ (i,j)$ 位置的元素为矩阵函数关于\(A\) 在$ (i,j)$ 位置变量的导数 ,即,
\[ \nabla_{A} f(A)=\left[ \begin{array}{ccc} {\frac{\partial f}{\partial A_{11}}} & {\cdots} & {\frac{\partial f}{\partial A_{1 n}}} \\ {\vdots} & {\ddots} & {\vdots} \\ {\frac{\partial f}{\partial A_{m 1}}} & {\cdots} & {\frac{\partial f}{\partial A_{m n}}} \end{array}\right] \]
举个例子,现有矩阵函数 \(f : \mathbb{R}^{2 \times 2} \mapsto \mathbb{R}\)
\[ f(A)=\frac{3}{2} A_{11}+5 A_{12}^{2}+A_{21} A_{22} \]
则其关于矩阵\(A\) 的导数为,
\[ \nabla_{A} f(A)=\left[ \begin{array}{cc}{\frac{3}{2}} & {10 A_{12}} \\ {A_{22}} & {A_{21}} \end{array}\right] \]

迹与迹的性质

定义迹算子(trace operator)为对角线元素之和,即,
\[ \operatorname{tr} A=\sum_{i=1}^{n} A_{i i} \]
两个相乘起来是方阵的矩阵\(AB\) ,具有如下性质,
\[ \operatorname{tr} A B=\operatorname{tr} B A \]
由此性质有以下推论,
\[ \begin{aligned} \operatorname{tr} A B C=\operatorname{tr} C A B=\operatorname{tr} B C A \\ \operatorname{tr} A B C D=\operatorname{tr} D A B C=\operatorname{tr} C D A B=\operatorname{tr} B C D A \end{aligned} \]
\(a\) 是一个实数,下列迹的性质也不难验证,
\[ \begin{aligned} \operatorname{tr} A &=\operatorname{tr} A^{T} \\ \operatorname{tr}(A+B) &=\operatorname{tr} A+\operatorname{tr} B \\ \operatorname{tr} a A &=a \operatorname{tr} A \end{aligned} \]

矩阵导数性质

矩阵导数有下列性质,
\[ \begin{equation} \begin{aligned} \nabla_{A}\operatorname{tr}A B &=B^{T} \\ \nabla_{A^{T}} f(A) &=\left(\nabla_{A} f(A)\right)^{T} \\ \nabla_{A} \operatorname{tr}A B A^{T} C &=C A B+C^{T} A B^{T} \\ \nabla_{A}|A| &=|A|\left(A^{-1}\right)^{T} \end{aligned} \end{equation} \]
对其求导的那个矩阵,一般看做是变量。对于第一个性质,假设我们有一个固定的 \(n \times m\) 矩阵\(B\) ,则\(\operatorname{tr}A B\) 可以看做一个 \(f : \mathbb{R}^{m \times n} \mapsto \mathbb{R}\) 矩阵函数,第一个性质是说对于\(A\) 求导的$ (i,j)$ 位置结果就是\(B\) 矩阵$ (j,i)$ 位置的元素。

用了再看,不用紧张,知道大意即可,有时间了可以真的来“不难验证”一番。

猜你喜欢

转载自www.cnblogs.com/qizhien/p/11569481.html