无线信道参数估计算法

对通信系统分析之前，首先需要建立一个能够完整反映该系统的传输信道的模型，其模型中的参数包括接收端接收信号的时延，发射端和接收端的联合方向分布等，获取这些参数的过程就是无线信道参数估计的过程。

方法可以大致分为三类：
- 谱估计算法：多重信号分类法
- 参数子空间估计算法：旋转不变技术估计信号参数算法
- 确定性参数估计算法：期望最大算法以及演进的空间交替广义期望最大算法

0. 前言

阵列信号处理基础本质上属于参数估计问题，和信道估计知识基本上别无二致。末学在这里整理了阵列信号处理的基础知识，包括公式推导，以及代码。一方面为了节省同行人士寻找资料和整理吸收的时间，开方便之门。另一方面为了和大家多多交流这方面的知识，寻找研究灵感。

如果有任何问题或者有相关的 MATLAB 代码，本着交流的态度请分享到我的邮箱：[email protected]。在这里很抱歉，我没有找到 SAGE 或者 EM 的阵列信号估计的代码，希望有代码的朋友可以分享一下给我，我会经过分析，整理成容易理解的代码分享给更多的学习者。

愿以此功德，庄严佛净土。上报四重恩，下济三途苦。
若有见闻者，悉发菩提心。尽此一报身，同生极乐国。

3. 期望最大算法

要想同时得到信道的多维参数信息，这里引入了 EM 算法来解决这一问题。EM 算法可以对无线传输信道中的无线电波进行幅度、时延、离幵角、到达角、多普勒谱的联合多重参数估计。

系统模型

考虑如下的传播环境模型。发射端有 $M$ 根天线组成的阵列 1，经过 $L$ 条路径传输到达接收端，接收端有 $N$ 根天线组成的阵列 2。在每条路径上，信号受到来自中途障碍物的干扰，发生不同程度的折射、反射、绕射等，使到达信号产生多径现象。

其中发射天线阵列由 $M$ 个相对任意参考点 $O_1$ 分别位于 $r_1,\cdots,r_M \in R^3$ 的阵元组成，接收天线阵列由 $N$ 个相对任意参考点 $O_2$ 分别位于 $r_1,\cdots,r_N \in R^3$ 的阵元组成。发射和接收天线阵列的阵元分别被限定在区域 $R_1$ 和 $R_2$ 中，这样我们假设的传播环境就满足了小尺度特性，对于我们后面的计算提供了便利。

sen

该模型假设：

远场条件：发射天线阵列和接收天线阵列的距离要求足够远，这样才能使得接收信号都可以看成平面波。同时保证发射天线轻微的移动几十个波长时，每条径所经历的几何衰落路径基本保持不变。
小尺度特性：发射天线阵和接收天线阵都限定在一定区域内，使得发射端和接收端天线阵中的阵元的坐标都可以用三维矢量表示。信道的衰落特性符合小尺度衰落特性，即只考虑由于幅度、时延、离开角、到达角、多普勒频移等小尺度特性造成的信号衰落。

发射信号为 $\sqrt{\frac{E}{T}}\mathbf{u}(t)$ ，其中 $T$ 和 $E$ 分别表示周期和在周期内的能量， $\mathbf{u}(t) = \left[u_1(t),\cdots,u_M(t)\right]^T$ 。

上述传播模型中假设有 $L$ 条波到达接收机，接收机总共有 $N$ 个天线阵元接收来波并对接收后的信号进行处理，这样第 $n$ 个天线阵元所得的信道冲激响应可以表示为：

h_{n} (t) = \sum_{l = 1}^{L} h_{l} e^{j 2 π v_{l} t} c_{2} (Ω_{2, l}) c_{1} (Ω_{1, l})^{T} δ (t - τ_{l})

$h_n(t) = \sum_{l=1}^{L} h_l e^{j2\pi v_l t} \boldsymbol c_2(\Omega_{2,l}) \boldsymbol c_1(\Omega_{1,l})^T \delta(t-\tau_l)$
天线阵接收到的信号可以表示成：

\begin{aligned} Y_{n} (t) & = \sqrt{\frac{E}{T}} u (t) * h_{n} (t) + N_{n} (t) \\ = \sum_{l = 1}^{L} \sqrt{\frac{E}{T}} h_{l} e^{j 2 π v_{l} t} c_{2} (Ω_{2, l}) c_{1} (Ω_{1, l})^{T} u (t - τ_{l}) + N_{n} (t) \\ = \sum_{l = 1}^{L} a_{l} e^{j 2 π v_{l} t} c_{2} (Ω_{2, l}) c_{1} (Ω_{1, l})^{T} u (t - τ_{l}) + N_{n} (t) \\ = \sum_{l = 1}^{L} s (t; θ_{l}) + N_{n} (t) \end{aligned}

$\begin{align*} Y_n(t) &= \sqrt{\frac{E}{T}}\mathbf{u}(t)*h_n(t)+N_n(t) \\ &= \sum_{l=1}^{L} \sqrt{\frac{E}{T}} h_l e^{j2\pi v_l t} \boldsymbol c_2(\Omega_{2,l}) \boldsymbol c_1(\Omega_{1,l})^T \mathbf{u}(t-\tau_l)+N_n(t) \\ &= \sum_{l=1}^{L} a_l e^{j2\pi v_l t} \boldsymbol c_2(\Omega_{2,l}) \boldsymbol c_1(\Omega_{1,l})^T \mathbf{u}(t-\tau_l)+N_n(t) \\ &= \sum_{l=1}^{L} \mathbf{s}(t;\boldsymbol{\theta}_l) +N_n(t) \end{align*}$
其中，经过第

l

$l$ 条路径传输来的信号矩阵定义为：

\begin{aligned} s (t; θ_{l}) & = {[s_{1} (t; θ_{l}), \dots, s_{N} (t; θ_{l})]}^{T} \\ = \sum_{l = 1}^{L} a_{l} e^{j 2 π v_{l} t} c_{2} (Ω_{2, l}) c_{1} (Ω_{1, l})^{T} u (t - τ_{l}) \end{aligned}

$\begin{align*} \mathbf{s}(t;\boldsymbol{\theta}_l) &= \left[ s_1(t;\boldsymbol{\theta}_l),\cdots,s_N(t;\boldsymbol{\theta}_l)\right]^T \\ &= \sum_{l=1}^{L} a_l e^{j2\pi v_l t} \boldsymbol c_2(\Omega_{2,l}) \boldsymbol c_1(\Omega_{1,l})^T \mathbf{u}(t-\tau_l) \end{align*}$
其中，

a_{l} = \sqrt{\frac{E}{T}} h_{l}

$a_l =\sqrt{\frac{E}{T}} h_l$ ，

N_{n} (t) = N_{n ℜ} (t) + j N_{n ℑ} (t)

$N_n(t) = N_{n \Re}(t)+jN_{n \Im}(t)$ ，

N_{n ℜ} (t)

$N_{n \Re}(t)$ 和

N_{n ℑ} (t)

$N_{n \Im}(t)$ 均为具有单位频谱高度的零均值高斯白噪声过程，且相互独立，其双边功率谱密度为

\frac{N_{0}}{2}

$\frac{N_0}{2}$ ，满足

E [N_{n} (t)^{H} N_{n} (t)] = 2 δ (t^{'} - t)

$\mathbb{E}\left[N_n(t)^HN_n(t)\right] = 2\delta(t'-t)$ 。所以阵列 2 的接收信号为

\begin{aligned} Y (t) & = {[Y_{1} (t), \dots, Y_{N} (t)]}^{T} \\ = \sum_{l = 1}^{L} s (t; θ_{l}) + \sqrt{\frac{N_{0}}{2}} N (t) \end{aligned}

$\begin{align*} \mathbf{Y} (t) &= \left[ Y_1(t),\cdots,Y_N(t)\right]^T \\ &= \sum_{l=1}^{L} \mathbf{s}(t;\boldsymbol{\theta}_l) +\sqrt{\frac{N_0}{2}} \mathbf{N}(t) \end{align*}$
其中，

N (t) = {[N_{1} (t), \dots, N_{N} (t)]}^{T}

$\mathbf{N}(t) = \left[ N_1(t),\cdots,N_N(t)\right]^T$ 是

N

$N$ 维复高斯白噪声向量值。

θ_{l} = [Ω_{1, l}, Ω_{2, l}, τ_{l}, v_{l}, a_{l}]

$\boldsymbol{\theta}_l =\left[ \Omega_{1,l},\Omega_{2,l}, \tau_l, v_l,a_l\right]$ 表示第

l

$l$ 条路径的平面波参数矩阵。第

l

$l$ 条路径的平面波由离开方向角

Ω_{1, l}

$\Omega_{1,l}$ 、到达方向角

Ω_{2, l}

$\Omega_{2,l}$ 、传播时延

τ_{l}

$\tau_l$ 、多普勒频移

v_{l}

$v_l$ 和复振幅

a_{l}

$a_l$ 来表征。因此，信道参数提取算法的核心就在于准确有效地估计这 5 个信道参数的信息。

为了简洁表达，我们定义 $\mathbf{s}(t;\boldsymbol{\theta}) = \sum_{l=1}^{L} \mathbf{s}(t;\boldsymbol{\theta}_l)$ ，其中 $\boldsymbol{\theta} = \left[ \boldsymbol{\theta}_1,\cdots,\boldsymbol{\theta}_L \right]^T$ 。为了方便描述到达角和离开角的方向，在这里引入球坐标。

qiu

首先初始点设定为 $O$ 处，以这个点为球心画出一个半径为 1 的球，确定一个方向，作为单位向量 $Ω$ 。球面坐标系的单位向量为：

Ω == [\sin θ \cos ϕ, \sin θ \sin ϕ, \cos θ]^{T}

$\Omega = =[\sin \theta \cos \phi,\sin \theta \sin \phi,\cos \theta]^T$
其中角度

ϕ \in [- π, π)

$\phi \in[-\pi,\pi)$ 为单位矢量

Ω

$Ω$ 的水平方向角，角度

θ \in [0, π]

$\theta\in[0,\pi]$ 表示单位矢量

Ω

$Ω$ 的垂直方向角。于是有

\begin{aligned} c_{2} (Ω_{2}) & = {[f_{2, 1} (Ω_{2}) \exp {j 2 π λ_{0}^{- 1} (Ω_{2} \cdot r_{2, 1})}, \dots, f_{2, N} (Ω_{2}) \exp {j 2 π λ_{0}^{- 1} (Ω_{2} \cdot r_{2, N})}]}^{T} \\ c_{1} (Ω_{1}) & = {[f_{1, 1} (Ω_{1}) \exp {j 2 π λ_{0}^{- 1} (Ω_{1} \cdot r_{1, 1})}, \dots, f_{1, M} (Ω_{1}) \exp {j 2 π λ_{0}^{- 1} (Ω_{1} \cdot r_{1, M})}]}^{T} \end{aligned}

$\begin{align*} \boldsymbol c_2(\Omega_{2}) & = \left[ f_{2,1}(\Omega_{2})\exp\{j2\pi \lambda_0^{-1}(\Omega_{2} \cdot \boldsymbol r_{2,1})\},\cdots,f_{2,N}(\Omega_{2})\exp\{j2\pi \lambda_0^{-1}(\Omega_{2} \cdot \boldsymbol r_{2,N})\}\right]^T \\ \boldsymbol c_1(\Omega_{1}) & = \left[ f_{1,1}(\Omega_{1})\exp\{j2\pi \lambda_0^{-1}(\Omega_{1} \cdot \boldsymbol r_{1,1})\},\cdots,f_{1,M}(\Omega_{1})\exp\{j2\pi \lambda_0^{-1}(\Omega_{1} \cdot \boldsymbol r_{1,M})\}\right]^T \end{align*}$
上述表达式中

λ_{0}

$\lambda_0$ 为传播波的波长，

f_{1, m} (Ω_{1})

$f_{1,m}(\Omega_{1})$ 为发射天线阵列第

m

$m$ 个阵元的复电场模式，

f_{2, n} (Ω_{2})

$f_{2,n}(\Omega_{2})$ 为接收天线阵列第

n

$n$ 个阵元的复电场模式，

(\cdot)

$(\cdot)$ 为内积符号。

由观测时间 $PT$ 内的观测值 $\mathbf Y(t)=y(t)$ 可得 $\boldsymbol \theta$ 的对数似然函数：

L (θ; y) = \frac{1}{N_{0}} [2 \underset{G_{1}}{\underset{⏟}{\int_{P T} ℜ {s^{H} (t; θ) y (t)} d t}} - \underset{G_{2}}{\underset{⏟}{\int_{P T} ‖ s (t; θ) ‖^{2} d t}}]

$L(\boldsymbol \theta;y) = \frac{1}{N_0} \left[ 2 \underbrace{\int_{PT} \Re\left\{\mathbf{s}^H(t;\boldsymbol{\theta}) y(t)\right\} dt}_{G_1}- \underbrace{\int_{PT} \Vert \boldsymbol{s}(t;\boldsymbol{\theta}) \Vert^2 dt}_{G_2} \right]$
其中，

ℜ (\cdot)

$\Re(\cdot)$ 表示取实部。

θ

$\boldsymbol \theta$ 的最大似然估计的结果就是使对数似然函数

L (θ; y)

$L(\boldsymbol \theta;y)$ 取最大值的向量，即

{\hat{θ}}_{M L} (y) = \underset{θ_{l}}{\arg max} {L (θ; y)}

$\hat{\boldsymbol \theta}_{ML}(y)= \underset{\boldsymbol \theta_l}{\arg \max} \{L(\boldsymbol \theta;y)\}$

对于信道中多径数目较大时，上式是关于 $L(\boldsymbol \theta;y)$ 的非线性函数，计算机无法直接对其进行求解。

EM 算法原理

EM 算法的推导基于两个主要概念：完全数据（不可观测）和不完全数据（可观测）。其思想是：你知道一些东西（观察到的数据），你不知道一些东西（观察不到的数据），如果你想知道那些不了解的东西，采取的方法就是根据一些假设 (parameter) 先猜 (E-step)，把不知道的事都猜出来，基于知道的和猜测的数据，假装你全都知道了，然后根据猜测的数据，你反思 (M-step)一下，更新假设，使得观察到的数据更加可能。然后再猜，再反思，最后就得到可以解释整个数据的假设了。

EM 算法的核心思想是将需要估计的参数集 $\boldsymbol \theta$ 分割成参数子集 $\theta_1,\cdots,\theta_l$ 顺序估计。

定义 $Y(t)$ 为实际数据的不完整可观测值，可表示成一组完整但不可观测的数据的函数 $\left[ X_1(t),\cdots,X_L(t)\right]$ ，其中 $X_l(t) = \boldsymbol{s}(t;\boldsymbol{\theta}_l)+\sqrt{\beta_l}\sqrt{\frac{N_0}{2}}N_l(t)$ ，在这里重新定义 $\boldsymbol N(t) = \left[ \sqrt{\beta_1}N_1(t),\cdots,\sqrt{\beta_L}N_L(t) \right]$ 是方差为 $\beta_l$ 的高斯平稳噪声，且 $N_l(t)$ 之间相互独立。其中 $\beta_l$ 为正值，且 $\sum_{l=1}^{L} \beta_l = 1$ 。则不完整数据可以表示为完整数据的函数：

Y (t) = \sum_{l = 1}^{L} X_{l} (t) = \sum_{l = 1}^{L} s (t; θ_{l}) + \sum_{l = 1}^{L} \sqrt{β_{l}} \sqrt{\frac{N_{0}}{2}} N_{l} (t)

$Y(t) = \sum_{l=1}^{L} X_l(t) = \sum_{l=1}^{L} \boldsymbol{s}(t;\boldsymbol{\theta}_l)+\sum_{l=1}^{L} \sqrt{\beta_l}\sqrt{\frac{N_0}{2}}N_l(t)$
可测数据与不可测数据转换示意图：

net

我们假设完全数据 $X$ 是可以观测的。由于 $X_1(t),\cdots,X_L(t)$ 相互独立，故对第 $l$ 条路径的传播参数 $\boldsymbol \theta_l$ 的估计与其它路径无关。由观测时间 $PT$ 内的观测值 $X_l(t) = x_l(t)$ ，可得 $\boldsymbol \theta_l$ 的对数似然函数：

L (θ_{l}; x_{l}) = \frac{1}{β_{l} N_{0}} [2 \underset{G_{1}}{\underset{⏟}{\int_{P T} ℜ {s^{H} (t; θ_{l}) x_{l} (t)} d t}} - \underset{G_{2}}{\underset{⏟}{\int_{P T} ‖ s (t; θ_{l}) ‖^{2} d t}}]

$L(\boldsymbol \theta_l;x_l) = \frac{1}{\beta_l N_0} \left[ 2 \underbrace{\int_{PT} \Re\left\{\mathbf{s}^H(t;\boldsymbol{\theta}_l) x_l(t)\right\} dt}_{G_1}- \underbrace{\int_{PT} \Vert \boldsymbol{s}(t;\boldsymbol{\theta}_l) \Vert^2 dt}_{G_2} \right]$
对于已知观测值

X_{l} (t) = x_{l} (t)

$X_l(t) = x_l(t)$ ，

θ_{l}

$\boldsymbol \theta_l$ 的最大似然估计为：

(\hat{θ_{l}})_{M L} (x_{l}) = \underset{θ_{l}}{\arg max} {L (θ_{l}; x_{l})}

$(\hat{\boldsymbol \theta_l})_{ML}(x_l) = \underset{\boldsymbol \theta_l}{\arg \max} \{L(\boldsymbol \theta_l;x_l)\}$
因为

X_{l} (t)

$X_l(t)$ 是不可观测的完全数据，这里采用可以观测的不完全数据

Y (t) = y (t)

$Y(t) =y(t)$ 以及

θ

$\boldsymbol \theta$ 的上一次估计值

{\hat{θ}}^{'}

$\hat{\boldsymbol \theta}'$ 对其进行估计。于是可以利用已知的

Y (t) = y (t)

$Y(t) =y(t)$ 以及假设的

θ = {\hat{θ}}^{'}

$\boldsymbol \theta = \hat{\boldsymbol \theta}'$ 从而计算

X_{l} (t)

$X_l(t)$ 条件期望：

x_{l} (t; {\hat{θ}}^{'}) = E_{{\hat{θ}}^{'}} [X_{l} (t) | Y (t) = y (t)], l = 1, 2, \dots, L

$\color{#00F}{x_l \left(t;\hat{\theta}' \right) = \mathbb{E}_{\hat{\theta}'}\left[X_l(t) \Big\vert Y(t) =y(t) \right], \quad l=1,2,\cdots,L}$
此处，

E_{{\hat{θ}}^{'}} (\cdot)

$\mathbb{E}_{\hat{\theta}'}(\cdot)$ 指在假设参数值

θ

$\boldsymbol \theta$ 情况下的期望。利用条件期望所得的

x_{l} (t; {\hat{θ}}^{'})

$x_l \left(t;\hat{\theta}' \right)$ 作为

X_{l} (t)

$X_l(t)$ 的观测值，然后通过最大似然估计对传播波参数矢量

θ_{l}

$\boldsymbol \theta_l$ 进行再估计：

{\hat{θ_{l}}}^{″} = (\hat{θ_{l}})_{M L} ({\hat{x}}_{l} (t; {\hat{θ}}^{'})), l = 1, 2, \dots, L

$\color{#00F}{\hat{\boldsymbol \theta_l}'' =(\hat{\boldsymbol \theta_l})_{ML} \left(\hat{x}_l (t;\hat{\theta}') \right), \quad l=1,2,\cdots,L}$

总结以上两个公式就对应着 EM 算法的操作：

EM 算法	公式
E（求期望）	$x_l \left(t;\hat{\theta}' \right) =\mathbb{E}_{\hat{\theta}'}\left[X_l(t) \Big\vert Y(t) =y(t) \right],\quad l=1,2,\cdots,L$
M （最大化）	$\hat{\boldsymbol \theta_l}''=(\hat{\boldsymbol \theta_l})_{ML} \left(\hat{x}_l (t;\hat{\theta}') \right),\quad l=1,2,\cdots,L$

对于任意初始值 $\hat{\boldsymbol \theta}(0)$ ，多次交替迭代执行 E 和 M 步骤。对于第 $\mu$ 次迭代，由初始值 $\hat{\boldsymbol \theta}(\mu -1)$ 去求得每一径传播波的参数 $\hat{\boldsymbol \theta}_l(\mu )$ 。迭代到收敛为止。

算法的 M 步骤，根据函数 $x_l \left(t;\hat{\theta}' \right)$ 的特殊结构，其参数向量 ${\boldsymbol \theta_l}=[\Omega_{1,l},\Omega_{2,l}, \tau_l, v_l,a_l]=[\bar{\boldsymbol \theta}_l,a_l]$ 可以简化为以下几个步骤。首先将 $a_l$ 固定，求函数另外 $4L$ 个维度的联合最大化，为了进一步简化该步骤，可以将联合最大化变成 4 个参数分别的最大化。求得 $\hat{\Omega}''_{1,l},\hat{\Omega}''_{2,l}, \hat{\tau}''_l, \hat v''_l$ 。之后可以通过以 $\hat{\Omega}''_{1,l},\hat{\Omega}''_{2,l}, \hat{\tau}''_l, \hat v''_l$ 为函数的闭合表达式得到 $\hat{a}''_l$ 。将复振幅 $a_l$ 的值代入到 $L(\boldsymbol \theta_l;x_l)$ 中，调整 M 步骤的公式如下：

\begin{aligned} (\hat{{\bar{θ}}_{l}})_{M L} (x_{l}) & = \underset{{\bar{θ}}_{l}}{\arg max} {z ({\bar{θ}}_{l}; x_{l})}, \\ (\hat{a_{l}})_{M L} (x_{l}) & = \frac{z ({\bar{θ}}_{l}; x_{l}) |_{{\bar{θ}}_{l} = (\hat{{\bar{θ}}_{l}})_{M L} (x_{l})}}{| c_{2} (({\hat{Ω}}_{2, l})_{M L}) | \cdot | c_{1} (({\hat{Ω}}_{1, l})_{M L}) | I \cdot P \cdot T_{S C}} . \end{aligned}

$\color{#00F}{ \begin{align*} (\hat{\bar{\boldsymbol{\theta}}_l})_{ML}(x_l) &= \underset{\bar{\boldsymbol \theta}_l}{\arg \max} \{z\left(\bar{\boldsymbol \theta}_l;x_l\right)\},\\ (\hat{a_l})_{ML}(x_l) &= \frac{z\left(\bar{\boldsymbol \theta}_l;x_l\right) \bigg\vert _{\bar{\boldsymbol \theta}_l =(\hat{\bar{\boldsymbol{\theta}}_l})_{ML}(x_l)}} {\Big\vert \boldsymbol c_2\left( (\hat{\boldsymbol{\Omega}}_{2,l})_{ML}\right) \Big\vert \cdot \Big\vert \boldsymbol c_1\left( (\hat{\boldsymbol{\Omega}}_{1,l})_{ML}\right) \Big\vert I\cdot P \cdot T_{SC}}. \end{align*} }$

其中相关文献中介绍的无线信道探测仪在接收端和发射端都配备了射频天线开关，这里采用时分多路复用(TDM) 模式进行无线信道的探测。用 $I$ 表示发射端循环周期的个数，将 $I$ 个循环周期定义为一个快拍。发射端发送周期为 $T_s$ 且功率为 $P$ 的探测信号。对于接收端，由于射频天线开关的作用，接收天线阵列的 $N$ 个阵元也相继对接收信号进行扫描，每个阵元的扫描时间为 $T_{SC}$ 。

\begin{aligned} z ({\bar{θ}}_{l}; x_{l}) & = f ({\bar{θ}}_{l})^{H} D (Ω_{1, l}, Ω_{2, l}) f ({\bar{θ}}_{l}) \\ = {\tilde{c}}_{2} (Ω_{2, l})^{H} X_{l} (τ_{l}, v_{l}) {\tilde{c}}_{1} (Ω_{1, l})^{*} \end{aligned}

$\begin{align*} z\left(\bar{\boldsymbol \theta}_l;x_l\right) &= \boldsymbol f(\bar{\boldsymbol \theta}_l)^H \boldsymbol D(\Omega_{1,l},\Omega_{2,l}) \boldsymbol f(\bar{\boldsymbol \theta}_l) \\ &= \widetilde{\boldsymbol c}_{2}(\Omega_{2,l})^H \boldsymbol X_l(\tau_l,v_l) \widetilde{\boldsymbol c}_{1}(\Omega_{1,l})^* \end{align*}$
其中，

\begin{aligned} f ({\bar{θ}}_{l}) & = [\begin{matrix} c_{2, 1} (Ω_{2, l})^{H} X_{l} (τ_{l}, v_{l}) c_{1, 1} (Ω_{1, l})^{*} \\ c_{2, 1} (Ω_{2, l})^{H} X_{l} (τ_{l}, v_{l}) c_{1, 2} (Ω_{1, l})^{*} \\ c_{2, 2} (Ω_{2, l})^{H} X_{l} (τ_{l}, v_{l}) c_{1, 1} (Ω_{1, l})^{*} \\ c_{2, 2} (Ω_{2, l})^{H} X_{l} (τ_{l}, v_{l}) c_{1, 2} (Ω_{1, l})^{*} \end{matrix}], \\ {\tilde{c}}_{2} (Ω_{2, l}) & = \frac{c_{2} (Ω_{2, l})}{| c_{2} (Ω_{2, l}) |}, \\ {\tilde{c}}_{1} (Ω_{1, l}) & = \frac{c_{1} (Ω_{1, l})}{| c_{1} (Ω_{1, l}) |} . \end{aligned}

$\begin{align*} \boldsymbol f(\bar{\boldsymbol \theta}_l) &= \begin{bmatrix} \boldsymbol c_{2,1}(\Omega_{2,l})^H \boldsymbol X_l(\tau_l,v_l) \boldsymbol c_{1,1}(\Omega_{1,l})^*\\ \boldsymbol c_{2,1}(\Omega_{2,l})^H \boldsymbol X_l(\tau_l,v_l) \boldsymbol c_{1,2}(\Omega_{1,l})^*\\ \boldsymbol c_{2,2}(\Omega_{2,l})^H \boldsymbol X_l(\tau_l,v_l) \boldsymbol c_{1,1}(\Omega_{1,l})^*\\ \boldsymbol c_{2,2}(\Omega_{2,l})^H \boldsymbol X_l(\tau_l,v_l) \boldsymbol c_{1,2}(\Omega_{1,l})^* \end{bmatrix} ,\\ \widetilde{\boldsymbol c}_{2}(\Omega_{2,l}) &= \frac{\boldsymbol c_{2}(\Omega_{2,l})}{\vert \boldsymbol c_{2}(\Omega_{2,l}) \vert} ,\\ \widetilde{\boldsymbol c}_{1}(\Omega_{1,l}) &= \frac{\boldsymbol c_{1}(\Omega_{1,l})}{\vert \boldsymbol c_{1}(\Omega_{1,l}) \vert}. \end{align*}$

X_{l} (τ_{l}, v_{l})

$\mathbf{ X}_l(\tau_l,v_l)$ 是

N \times M

$N \times M$ 维的矩阵，其中每一个元素如下所示：

x_{l, n, m} (t; τ_{l}, v_{l}) = \sum_{i = 1}^{I} \exp {- j 2 π v_{l} t_{i, n, m}} \cdot \int_{0}^{T_{S C}} u (t - τ_{l})^{*} \exp {- j 2 π v_{l} t} x_{l} (t + t_{i, n, m}) d t

$x_{l,n,m}(t;\tau_l,v_l) = \sum_{i=1}^{I} \exp \left\{-j2\pi v_lt_{i,n,m}\right\} \cdot \int_{0}^{T_{SC}} u(t-\tau_l)^* \exp \{-j2\pi v_lt\} x_l(t+t_{i,n,m}) dt$
其中，

D (Ω_{1, l}, Ω_{2, l}) = [c_{2} (Ω_{2, l})^{H} c_{2} (Ω_{2, l})] \otimes [c_{1} (Ω_{1, l})^{H} c_{1} (Ω_{1, l})]

$\boldsymbol D(\Omega_{1,l},\Omega_{2,l}) = [\boldsymbol c_{2}(\Omega_{2,l})^H \boldsymbol c_{2}(\Omega_{2,l})]\otimes[\boldsymbol c_{1}(\Omega_{1,l})^H\boldsymbol c_{1}(\Omega_{1,l})]$ 。为了保证算法的 M 步骤中的对于参数矩阵的估计有解，需要满足矩阵

D (Ω_{1, l}, Ω_{2, l})

$\boldsymbol D(\Omega_{1,l},\Omega_{2,l})$ 的非奇异值条件，即行列式不为 0：

det (D (Ω_{1, l}, Ω_{2, l})) = \prod_{k = 1}^{2} {(| c_{k, 1} (Ω_{k}) |^{2} | c_{k, 2} (Ω_{k}) |^{2} - | c_{k, 2} (Ω_{k})^{H} c_{k, 1} (Ω_{k}) |^{2})}^{2}

$\det \left(\boldsymbol D(\Omega_{1,l},\Omega_{2,l})\right) = \prod_{k=1}^{2} \left(\Big\vert \boldsymbol c_{k,1}(\Omega_{k}) \Big\vert^2 \Big\vert \boldsymbol c_{k,2}(\Omega_{k}) \Big\vert^2 - \Big\vert \boldsymbol c_{k,2}(\Omega_{k})^H \boldsymbol c_{k,1}(\Omega_{k}) \Big\vert^2 \right)^2$
发现上式

det (D (Ω_{1, l}, Ω_{2, l})) \geq 0

$\det \left(\boldsymbol D(\Omega_{1,l},\Omega_{2,l})\right) \geq 0$ ，当且仅当

c_{k, 1} (Ω_{k})

$\boldsymbol c_{k,1}(\Omega_{k})$ 和

c_{k, 2} (Ω_{k})

$\boldsymbol c_{k,2}(\Omega_{k})$ 线性相关时，等号才成立。故矩阵

D (Ω_{1, l}, Ω_{2, l})

$\boldsymbol D(\Omega_{1,l},\Omega_{2,l})$ 是非奇异矩阵的充要条件为：对于任意的

Ω_{k}, (k = 1, 2)

$\Omega_k, \ (k=1,2)$ ，

c_{k, 1} (Ω_{k})

$\boldsymbol c_{k,1}(\Omega_{k})$ 和

c_{k, 2} (Ω_{k})

$\boldsymbol c_{k,2}(\Omega_{k})$ 都是线性不相关的。

SAGE 算法

根据似然函数

L (θ_{l}; x_{l}) = \frac{1}{β_{l} N_{0}} [2 \underset{G_{1}}{\underset{⏟}{\int_{P T} ℜ {s^{H} (t; θ_{l}) x_{l} (t)} d t}} - \underset{G_{2}}{\underset{⏟}{\int_{P T} ‖ s (t; θ_{l}) ‖^{2} d t}}]

$L(\boldsymbol \theta_l;x_l) = \frac{1}{\beta_l N_0} \left[ 2 \underbrace{\int_{PT} \Re\left\{\mathbf{s}^H(t;\boldsymbol{\theta}_l) x_l(t)\right\} dt}_{G_1}- \underbrace{\int_{PT} \Vert \boldsymbol {s}(t;\boldsymbol{\theta}_l) \Vert^2 dt}_{G_2} \right]$
其中，

\begin{aligned} G_{1} & = a_{l}^{*} c_{2} (Ω_{2, l})^{H} X_{l} (τ_{l}, v_{l}) c_{1} (Ω_{1, l})^{*}, \\ G_{2} & = | a_{l} |^{2} | c_{2} (Ω_{2, l}) |^{2} | c_{1} (Ω_{1, l}) |^{2} I P T_{S C} . \end{aligned}

$\begin{align*} G_1 &= a_l^* \boldsymbol c_{2}(\Omega_{2,l})^H \boldsymbol X_l(\tau_l,v_l) \boldsymbol c_{1}(\Omega_{1,l})^* ,\\ G_2 &= \vert a_l \vert^2 \Big\vert\boldsymbol c_{2}(\Omega_{2,l}) \Big\vert^2 \Big\vert \boldsymbol c_{1}(\Omega_{1,l})\Big\vert^2 IPT_{SC} . \end{align*}$
于是，代入整理可得似然函数

L (θ_{l}; x_{l}) \propto 2 | c_{2} (Ω_{2, l}) | \cdot | c_{1} (Ω_{1, l}) | ℜ {a_{l}^{*} z ({\bar{θ}}_{l}; x_{l})} - | a_{l} |^{2} | c_{2} (Ω_{2, l}) |^{2} | c_{1} (Ω_{1, l}) |^{2} I P T_{S C} .

$L(\boldsymbol \theta_l;x_l) \propto 2\Big\vert\boldsymbol c_{2}(\Omega_{2,l}) \Big\vert \cdot \Big\vert \boldsymbol c_{1}(\Omega_{1,l})\Big\vert \Re\left\{a_l^* z\left(\bar{\boldsymbol \theta}_l;x_l\right) \right\} - \\ \vert a_l \vert^2 \Big\vert\boldsymbol c_{2}(\Omega_{2,l}) \Big\vert^2 \Big\vert \boldsymbol c_{1}(\Omega_{1,l})\Big\vert^2 IPT_{SC} .$
SAGE 算法是针对 EM 算法 每次迭代都要更新所有参数这一缺陷所提出的一种优化扩展算法。SAGE 算法的主要思想是：在 EM 算法的基础上将参数矩阵空间集分割成维数较小的参数子集，每次迭代只更新部分参数子集，而其余补集保持不变。具体的做法为：将每一径的参数矩阵分割为 6 个参数子集：

θ_{l} = [Ω_{1, l}, Ω_{2, l}, τ_{l}, v_{l}, a_{l}] ⟹ {τ_{l}, a_{l}}, {θ_{2, l}, a_{l}}, {ϕ_{2, l}, a_{l}}, {θ_{1, l}, a_{l}}, {ϕ_{1, l}, a_{l}}, {v_{l}, a_{l}} .

${\boldsymbol \theta_l}=[\Omega_{1,l},\Omega_{2,l}, \tau_l, v_l,a_l] \\ \Longrightarrow \\ \{\tau_l, a_l\}, \\ \{\theta_{2,l},a_l\}, \\ \{\phi_{2,l},a_l\}, \\ \{\theta_{1,l},a_l\}, \\ \{\phi_{1,l},a_l\}, \\ \{v_l,a_l\}.$
对于不可观测的完全数据

X_{l} (t)

$X_l(t)$ 的估计与

{\hat{θ}}^{'}

$\hat{\boldsymbol \theta}'$ 是无关的。所以对参数空间集进行分割不影响求期望步骤的进行，每个子集的求期望步骤是完全一致的。在迭代的过程中，每次只更新其中一个子集，其余补集都保持初始值不变，依次更新所有子集后一条路径一次迭代完成。对所有路径完成一次迭代即完成了一个迭代周期。只更新子集的做法可以减小 Fisher 信息，算法的运算复杂度得到显著降低，收敛速度明显加快。一次迭代所得到的参数矩阵的值如下所示：

\begin{aligned} {\hat{τ}}_{l}^{″} & = \underset{τ_{l}}{\arg max} z ({\hat{ϕ}}_{1, l}^{'}, {\hat{θ}}_{1, l}^{'}, {\hat{ϕ}}_{2, l}^{'}, {\hat{θ}}_{2, l}^{'}, τ_{l}, {\hat{v}}_{l}^{'}, {\hat{x}}_{l}), \\ {\hat{θ}}_{2, l}^{″} & = \underset{θ_{2, l}}{\arg max} z ({\hat{ϕ}}_{1, l}^{'}, {\hat{θ}}_{1, l}^{'}, {\hat{ϕ}}_{2, l}^{'}, θ_{2, l}, {\hat{τ}}_{l}^{″}, {\hat{v}}_{l}^{'}, {\hat{x}}_{l}), \\ {\hat{ϕ}}_{2, l}^{″} & = \underset{ϕ_{2, l}}{\arg max} z ({\hat{ϕ}}_{1, l}^{'}, {\hat{θ}}_{1, l}^{'}, ϕ_{2, l}, {\hat{θ}}_{2, l}^{″}, {\hat{τ}}_{l}^{″}, {\hat{v}}_{l}^{'}, {\hat{x}}_{l}), \\ {\hat{θ}}_{1, l}^{″} & = \underset{θ_{1, l}}{\arg max} z ({\hat{ϕ}}_{1, l}^{'}, θ_{1, l}, {\hat{ϕ}}_{2, l}^{″}, {\hat{θ}}_{2, l}^{″}, {\hat{τ}}_{l}^{″}, {\hat{v}}_{l}^{'}, {\hat{x}}_{l}), \\ {\hat{ϕ}}_{1, l}^{″} & = \underset{ϕ_{1, l}}{\arg max} z (ϕ_{1, l}, {\hat{θ}}_{1, l}^{″}, {\hat{ϕ}}_{2, l}^{″}, {\hat{θ}}_{2, l}^{″}, {\hat{τ}}_{l}^{″}, {\hat{v}}_{l}^{'}, {\hat{x}}_{l}), \\ {\hat{v}}_{l}^{″} & = \underset{v_{l}}{\arg max} z ({\hat{ϕ}}_{1, l}^{″}, {\hat{θ}}_{1, l}^{″}, {\hat{ϕ}}_{2, l}^{″}, {\hat{θ}}_{2, l}^{″}, {\hat{τ}}_{l}^{″}, v_{l}, {\hat{x}}_{l}) . \end{aligned}

$\begin{align*} \hat{\tau}_l'' &= \underset{\tau_l}{\arg \max} \ z(\hat{\phi}_{1,l}',\hat{\theta}_{1,l}',\hat{\phi}_{2,l}',\hat{\theta}_{2,l}',\tau_l,\hat{v}_l',\hat{x}_l), \\ \hat{\theta}_{2,l}'' &= \underset{\theta_{2,l}}{\arg \max} \ z(\hat{\phi}_{1,l}',\hat{\theta}_{1,l}',\hat{\phi}_{2,l}',\theta_{2,l},\hat{\tau}_l'',\hat{v}_l',\hat{x}_l), \\ \hat{\phi}_{2,l}'' &= \underset{{\phi}_{2,l}}{\arg \max} \ z(\hat{\phi}_{1,l}',\hat{\theta}_{1,l}',{\phi}_{2,l},\hat{\theta}_{2,l}'',\hat{\tau}_l'',\hat{v}_l',\hat{x}_l), \\ \hat{\theta}_{1,l}'' &= \underset{\theta_{1,l}}{\arg \max} \ z(\hat{\phi}_{1,l}',\theta_{1,l},\hat{\phi}_{2,l}'',\hat{\theta}_{2,l}'',\hat{\tau}_l'',\hat{v}_l',\hat{x}_l), \\ \hat{\phi}_{1,l}'' &= \underset{{\phi}_{1,l}}{\arg \max} \ z(\phi_{1,l},\hat{\theta}_{1,l}'',\hat{\phi}_{2,l}'',\hat{\theta}_{2,l}'',\hat{\tau}_l'',\hat{v}_l',\hat{x}_l), \\ \hat{v}_{l}'' &= \underset{v_l}{\arg \max} \ z(\hat{\phi}_{1,l}'',\hat{\theta}_{1,l}'',\hat{\phi}_{2,l}'',\hat{\theta}_{2,l}'',\hat{\tau}_l'',{v}_l,\hat{x}_l). \end{align*}$

最后

{\hat{a}}_{l}^{″} = {[| c_{2} (({\hat{ϕ}}_{2, l}^{″}, {\hat{θ}}_{2, l}^{″})) | \cdot | c_{1} (({\hat{ϕ}}_{1, l}^{″}, {\hat{θ}}_{1, l}^{″}) | I P T_{S C}]}^{- 1} \cdot z ({\hat{ϕ}}_{1, l}^{″}, {\hat{θ}}_{1, l}^{″}, {\hat{ϕ}}_{2, l}^{″}, {\hat{θ}}_{2, l}^{″}, {\hat{τ}}_{l}^{″}, {\hat{v}}_{l}^{″}, {\hat{x}}_{l})

$\hat{a}_l''= \left[ {\Big\vert \boldsymbol c_2\left( ( \hat{\phi}_{2,l}'',\hat{\theta}_{2,l}'') \right) \Big\vert \cdot \Big\vert \boldsymbol c_1\left( (\hat{\phi}_{1,l}'',\hat{\theta}_{1,l}''\right) \Big\vert I P T_{SC}} \right]^{-1} \cdot z(\hat{\phi}_{1,l}'',\hat{\theta}_{1,l}'',\hat{\phi}_{2,l}'',\hat{\theta}_{2,l}'',\hat{\tau}_l'',\hat{v}_{l}'',\hat{x}_l)$
于是 SAGE 算法具体步骤：

E 步骤

因为 $X_l(t)$ 不可观测，所以对数似然函数也不可计算。那么关键步骤是基于 $Y(t)=y(t)$ 估计 $X_l(t)$ 的条件期望：

\begin{aligned} x_{l} (t; {\hat{θ}}^{'}) & = E_{{\hat{θ}}^{'}} [X_{l} (t) | Y (t) = y (t)] \\ = y (t) - \sum_{l^{'} = 1, l^{'} \neq l}^{L} s (t; {\hat{θ}}_{l^{'}}^{'}) \end{aligned}

$\color{#F00}{ \begin{align*} x_l \left(t;\hat{\theta}' \right) &= \mathbb{E}_{\hat{\theta}'}\left[X_l(t) \Big\vert Y(t) =y(t) \right] \\ &= y(t)- \sum_{l'=1,l' \neq l}^{L} \boldsymbol{s}(t;\hat{\boldsymbol{\theta}}'_{l'}) \end{align*} }$

M 步骤

\begin{aligned} (\hat{{\bar{θ}}_{l}})_{M L} (x_{l}) & = \underset{{\bar{θ}}_{l}}{\arg max} {z ({\bar{θ}}_{l}; x_{l})}, \\ (\hat{a_{l}})_{M L} (x_{l}) & = \frac{z ({\bar{θ}}_{l}; x_{l}) |_{{\bar{θ}}_{l} = (\hat{{\bar{θ}}_{l}})_{M L} (x_{l})}}{| c_{2} (({\hat{Ω}}_{2, l})_{M L}) | \cdot | c_{1} (({\hat{Ω}}_{1, l})_{M L}) | I \cdot P \cdot T_{S C}} . \end{aligned}

从上可以看出，SAGE 算法和 EM 算法的 E 步骤和 M 步骤的公式在形式上是完全一样的。SAGE 算法和 EM 算法的求期望过程是完全一致的，但是 SAGE 算法在 EM 算法基础上，对其 M 步骤进行了改进：对于参数矩阵的估计是将其参数空间进行分割，将多维联合参数估计转化成一维参数估计。

阵列信号基础之3：EM 和 SAGE