信号处理中的求导

本文对信号处理中一些常用的求导作以记录，如有表述不当之处欢迎批评指正。欢迎任何形式的转载，但请务必注明出处。

1. 实值函数相对于复变量的梯度

a. 定义 $f (w)$ 是复变量 $w$ 的实函数；
b. 其中 $w$ 和 $w^{*}$ 分别表示为： $w = x + j y$ $w^{*}=x-jy$
c. 那么： $\frac{\partial{f}}{\partial{w}}=\frac{1}{2}(\frac{\partial{f}}{\partial{x}}-j\frac{\partial{f}}{\partial{y}})$ $\frac{\partial{f}}{\partial{w^{*}}}=\frac{1}{2}(\frac{\partial{f}}{\partial{x}}+j\frac{\partial{f}}{\partial{y}})$ $\frac{\partial{w}}{\partial{w}}=1$ $\frac{\partial{w}}{\partial{w^{*}}}=0$

2. 标量函数相对于复向量的梯度

a. 定义 $f(\vec{\bm{w}})$ 是复向量 $\vec{\bm{w}}$ 的标量函数；
b. 其中 $\vec{\bm{w}}=[w_0,...,w_{M-1}]^{T}$ $w_n=x_n+jy_n$
c. 那么
$\frac{\partial{f}}{\partial{\vec{\bm{w}}}}=\nabla_{\vec{\bm{w}}}f(\vec{\bm{w}})=[\frac{\partial{f}}{\partial{w_0}},...,\frac{\partial{f}}{\partial{w_{M-1}}}]^{T}$ $\frac{\partial{f}}{\partial{\vec{\bm{w^{*}}}}}=\nabla_{\vec{\bm{w^{*}}}}f(\vec{\bm{w}})=[\frac{\partial{f}}{\partial{w_0^{*}}},...,\frac{\partial{f}}{\partial{w_{M-1}^{*}}}]^{T}$

3. 向量函数相对于复向量的梯度

a. 定义 $\vec{\bm{f}}$ 是复向量 $\vec{\bm{w}}$ 的向量函数
b. 其中
$\vec{\bm{f}}=[f_0(\vec{\bm{w}}),...,f_{M-1}(\vec{\bm{w}})]^{T}$ $\vec{\bm{w}}=[w_0,...,w_{M-1}]^{T}$ $w_n = x_n + jy_n$
c. 那么
$\frac{\partial{\vec{\bm{f}}}}{\partial{\vec{\bm{w}}}}=\begin{bmatrix} \frac{\partial{f_0}}{\partial{w_0}},...,\frac{\partial{f_0}}{\partial{w_{M-1}}} \\ \frac{\partial{f_1}}{\partial{w_0}},...,\frac{\partial{f_1}}{\partial{w_{M-1}}} \\ ......... \\ \frac{\partial{f_{M-1}}}{\partial{w_0}},...,\frac{\partial{f_{M-1}}}{\partial{w_{M-1}}} \end{bmatrix}$
d. 结合上述概念可得到 $\frac{\partial{\vec{\bm{f}}}}{\partial{\vec{\bm{w^{*}}}}}$

4. 关于复变量/向量的一些结论

a. 定义 $\nabla=(\frac{\partial}{\partial{z_0^{*}}},...,\frac{\partial}{\partial{z_{N-1}^{*}}})^{T}$ $z_n=xn+jy_n$ $n = 0, . . ., N - 1$
b. $\frac{\partial}{\partial{z_n^{*}}}=\frac{1}{2}(\frac{\partial}{\partial{x_n}}+j\frac{\partial}{\partial{y_n}})$ $z_n=xn+jy_n$ $n = 0, . . ., N - 1$
c.
$\begin{cases} \frac{\partial{z}}{\partial{z^{*}}}=0\\ \frac{\partial{z}}{\partial{z}}=1\\ \frac{\partial{z^{*}}}{\partial{z^{*}}}=1 \end{cases}$
d.
$\begin{cases} \nabla(\vec{\bm{a}}^{H}\vec{\bm{z}}) = 0\\ \nabla(\vec{\bm{z}}^{H}\vec{\bm{a}}) = \vec{\bm{a}}\\ \nabla(\vec{\bm{z}}^{H}\vec{\bm{R}}\vec{\bm{z}}) = \vec{\bm{R}}\vec{\bm{z}}\\ \end{cases}$
其中 $\vec{\bm{a}}$ 和 $\vec{\bm{z}}$ 均为列向量， $\vec{\bm{R}}$ 为矩阵
e.
$f(\vec{\bm{w}})=\vec{\bm{p}}^{H}\vec{\bm{w}}\Rightarrow \begin{cases} \frac{\partial{f}}{\partial{\vec{\bm{w}}}}=\vec{\bm{p}}^{*}\\ \frac{\partial{f}}{\partial{\vec{\bm{w}}^{*}}}=0 \end{cases}$
其中 $\vec{\bm{p}}$ 和 $\vec{\bm{w}}$ 均为列向量， $f(\vec{\bm{w}})$ 为标量
f.
$f(\vec{\bm{w}})=\vec{\bm{w}}^{H}\vec{\bm{p}}\Rightarrow \begin{cases} \frac{\partial{f}}{\partial{\vec{\bm{w}}}}=0\\ \frac{\partial{f}}{\partial{\vec{\bm{w}}^{*}}}=\vec{\bm{p}} \end{cases}$
其中 $\vec{\bm{p}}$ 和 $\vec{\bm{w}}$ 均为列向量， $f(\vec{\bm{w}})$ 为标量
g.
$f(\vec{\bm{w}})=\vec{\bm{w}}^{H}\vec{\bm{A}}\vec{\bm{w}}\Rightarrow \begin{cases} \frac{\partial{f}}{\partial{\vec{\bm{w}}}}=\vec{\bm{A}}^{T}\vec{\bm{w}}^{*}\\ \frac{\partial{f}}{\partial{\vec{\bm{w}}^{*}}}=\vec{\bm{A}}\vec{\bm{w}} \end{cases}$
其中 $\vec{\bm{w}}$ 为列向量， $\vec{\bm{A}}$ 为矩阵， $f(\vec{\bm{w}})$ 为标量

5. 关于实变量/向量的一些结论

a. $\frac{\partial{\vec{\bm{a}}}^{T}{\vec{\bm{b}}}}{\partial{\vec{\bm{b}}}}=\frac{\partial{\vec{\bm{b}}}^{T}{\vec{\bm{a}}}}{\partial{\vec{\bm{b}}}}=\vec{\bm{a}}$
b. $\frac{\partial{\vec{\bm{b}}}^{T}{\vec{\bm{A}}}{\vec{\bm{b}}}}{\partial{\vec{\bm{b}}}}=2\vec{\bm{A}}\vec{\bm{b}}=2\vec{\bm{b}}^{T}\vec{\bm{A}}$
其中 $\vec{\bm{a}}$ 和 $\vec{\bm{b}}$ 均为列向量， $\vec{\bm{A}}$ 为对称矩阵

6. 参考文献

[1] 张贤达．矩阵分析与应用[M]．北京：高等教育出版社，2004．