前言

深度通信网络专栏: 快速上手： 2018-2019年最新深度学习用于无线通信（物理层）的论文整理，附论文核心思想总结与代码分析。一点拙见，如有偏颇，望不吝赐教，顺颂时祺。

文章中心思想

这篇文章一脉相承自 Deep Learning Coordinated Beamforming for Highly-Mobile Millimeter Wave Systems，不同点在于前者同时做了信道估计和波束成形，而这篇文章只聚焦于信道估计。这两篇都提出，只需要一个Omni-received signal即可估计出信道，这样大大降低了训练时长。但也因此，导致能给到神经网络的信息微乎其微，维度很低。然而作者联想到了GAN从低维数据恢复出高维数据的能力，并以此提出了本文的信道估计方法。即将需要估计的信道信息看做一张2D图片，从而通过GAN的方法来处理。这个方法，显然在通信的许多问题中，会有其应用的前景。

系统模型

在这里插入图片描述
本文考虑的场景比较神奇，是多个基站同时为一个高速运动的用户进行服务。这与他们的前作Deep Learning Coordinated Beamforming for Highly-Mobile Millimeter Wave Systems是相同的。可想而知，应该是提出的算法比较有局限性，因此选用了一种能将其优势体现的淋漓尽致的场景。因此，本文要考虑的是通过上行信道传输的pilot，来估计信道信息。作者假定了User端（发送端）天线数为1，而接收端为多天线并进行了波束成形。

信道模型

首先，作者使用了如下的宽带MISO信道模型：

$\boldsymbol{h}_{d, n}=\sqrt{\frac{M}{\rho}} \sum_{\ell=1}^{L} g_{n, \ell} p\left(d T_{s}-\tau_{n, \ell}\right) \mathbf{a}\left(\theta_{n, \ell}\right)$

一个经典的毫米波信道模型。具体可参考Frequency selective hybrid precoding for limited feedback millimeter wave systems。
显然，其频域信道可表示为：
$\mathbf{h}_{k, n}=\sum_{d=0}^{D-1} \boldsymbol{h}_{d, n} e^{-j \frac{2 \pi k}{K} d}，$
基于此，上行中BS接收到的信号可以表示为：
$y_{k, n}=\mathbf{w}_{n}^{T} \mathbf{h}_{k, n} s_{k}+v_{k}$

在本文行文中，下标 $n$ 表示第 $n$ 个基站。 $\mathbf{w}_{n}$ 是波束成形向量， $v_{k}$ 是高斯噪声。

网络相关

另外一个重要的假设是作者认为所有基站之间是可以协作的，也引出了本文网络的目标：

通过所有基站上收到的pilot，估计信道。因此，输入向量可写为 $\mathbf{y}=\left[y_{1,1}, \cdots, y_{K, 1}, y_{1,2}, \cdots, y_{K, 2}, \cdots, y_{K, N}\right]^{T}$
也就是所有基站所有子载波上的一个pilot的结合。
如同在Deep Learning Coordinated Beamforming for Highly-Mobile Millimeter Wave Systems提出的一样，这篇文章沿用了 **Omni-antenna patterns：

In [1], the authors showed that when the uplink training pilots are received simultaneously by multiple distributed basestations using omni or quasi-omni antenna patterns, these omni-received signals draw a rich multipath signature for the user location and its interaction with the surrounding environment.

简单概述下，这个omni-antenna pattern事实上就是，将接收波束成形向量( receive beamformer or combiner) 置为：
$\mathbf{w}_{n}=[1,0, \dots, 0], \forall n$
作者认为有两个重要优点：

不需要设计接受波束成形向量了，很方便。
这个omni-antenna pattern事实上包含了信道各个方向的信息，而不像传统的特定接收波束成形向量往往对准的是一个方向。也因此，作者认为每个子载波只需要一个omni-received signal就足够估计信道了。如果这一结果成立，显然是信道估计的重大突破。

稀疏变换

作者很快指出，想只用这么点数据估计信道实在太难。因此他进行了一些转换。首先，他将目标改为，估计信道的协方差矩阵。即：
$\mathbf{R}_{\mathbf{h}_{n}}=\mathbb{E}\left[\mathbf{h}_{k, n} \mathbf{h}_{k, n}^{H}\right]$
然后，利用毫米波信道稀疏的特性，将其进行稀疏分解，即
$\boldsymbol{h}_{d, n}=\mathbf{U}_{\mathrm{BS}} \boldsymbol{g}_{d, n}$
$\mathbf{U}_{\mathrm{BS}}$ 是DFT矩阵。由于空间中路径数十分有限，因此 $\boldsymbol{g}_{d, n}$ 中绝大部分元素都为0。（这一部分看不懂的同学可以查阅下作者给出的引文《An Overview of Signal Processing Techniques for Millimeter Wave MIMO Systems》）。
总之，作者将本文的目标改为稀疏矩阵 $\mathbf{R}_{\mathrm{g}_{n}}$ （文中称为 虚拟信道协方差）
$\mathbf{R}_{\mathbf{h}_{n}}=\mathbf{U}_{\mathrm{BS}} \mathbf{R}_{\mathrm{g}_{n}} \mathbf{U}_{\mathrm{BS}}^{H}$ 。
由于篇幅原因，这里的一些推导建议大家查看原文，但是对于大致理解这篇文章来说，只需要知道作者将一个信道估计的问题，转变为估计一个稀疏矩阵，以此来降低GAN的难度。正如作者原文所说:

it is much easier to learn the mapping from the omni-received uplink signature y to the virtual channel covariance matrices as compared to the original channel covariance matrix.

网络模型

在这里插入图片描述
如图，作者使用了经典的GAN网络模型，上方为生成器，下方为判别器。生成器的任务是：

通过导频序列，生成 $\mathbf{R}_{\mathrm{g}_{n}}$ 。可以理解为导频通过神经网络，输出了信道预测值。
本文和其他许多基于深度学习的信道估计文章不同， 其他文章往往以准确信道信息为标签，并计算网络输出值与真实值的MSE作为loss，不断训练网络缩小loss，而本文则是通过GAN的方式来完成训练：
$\begin{aligned} \min _{G} \max _{D} L(G, D) =\mathbb{E}_{\mathbf{R}_{\mathbf{\varepsilon}_{n}}}\left[\log D\left(\mathbf{R}_{\mathbf{g}_{n}} | \mathbf{y}\right)\right] +\mathbb{E}_{\mathbf{z}}[\log (1-D(G(\mathbf{z} | \mathbf{y})))] \end{aligned}$
这是GAN的经典公式：先固定生成器G，训练最优的判别器D来区分真实样本和生成样本。在这里，分别代表了真实信道信息和估计（生成）的信道信息。 然后，固定判别器D， 训练生成器，使得估计的信道信息尽可能贴近于真实信道信息。 来回迭代，直至收敛。
GAN相关的推导可以参考这里。 $G(\mathbf{z} | \mathbf{y}))$ 表示在接收的导频序列为 $\mathbf{y}$ 的情况下，通过噪声 $\mathbf{z}$ 生成（估计）的 $\mathbf{R}_{\mathbf{g}_{n}}$ , 也可以表示为 $\hat{\mathbf{R}}_{\mathbf{g}_{n}}=G(\mathbf{z}, \mathbf{y})$ 。

作者指出，由于所需要估计的信道信息的维度远大于输入的训练序列维度。因此，普通的DNN网络很难胜任（可以解释为什么作者没有沿用以MSE为loss反向传播训练一个网络）。而GAN，从低精度图片恢复出高分辨率的图片启发了作者，让他想到使用GAN，从低维度的接收信号去恢复信道信息。

具体网络设计：

生成器

生成器的具体结构展示在上图的上半部分。在传统的GAN中，生成器往往接收一组随机数（如：高斯噪声），通过训练生成想要的图片类型。但这里我们还需要考虑的是必须要给网络训练信息。因此，作者采用的思路是产生一个 $100\times1$ 的服从标准高斯分布的 $\mathbf{z}$ 噪声向量。然后将 $\mathbf{z}$ 与导频序列 $\mathbf{y}$ 拼接后，通过三层反卷积神经网络（参考），最后得到一个 $2\times32\times32$ （假设天线数为32））的实数矩阵，其中第一维的 $2$ 代表实部和虚部。 由于作者没有给出具体的代码，文章中也没有过多介绍，只能依靠给出的图片复现。

判别器

判别器的过程则是生成器的反向。重点在于经过两层卷积网络后，作者将导频序列与输出结果拼接，再通过最后一层神经网络，然后输出0或1. 这个拼接的网络又被称为conditioned CNN layer。个人认为这一步是必不可少的。我们的目标是根据导频序列估计出信道，那么判别器的目标就是输入信道，判别他是不是由这串导频序列得到的。

仿真结果

由于是信道估计问题，所以仿真也很好做，即：
$\mathrm{NMSE}=\frac{\left\|\hat{\mathbf{R}}_{\mathrm{g}_{\mathrm{n}}}-\mathbf{R}_{\mathrm{g}_{\mathrm{n}}}\right\|_{\mathrm{F}}^{2}}{\left\|\mathbf{R}_{\mathrm{g}_{\mathrm{n}}}\right\|_{\mathrm{F}}^{2}}$
通过归一化的偏差来衡量信道估计的准确度。
在这里插入图片描述
由于这个信道估计的方法过于特殊，加上非常另类的系统模型，作者直接没有给出任何对比算法。所有的仿真结果可以说是在自娱自乐，不太具有意义。加上仿真代码并未给出，这个方法的实用价值确实有待商榷。
但无论如何，这为深度通信网络打开了另一种思路，即结合当今深度学习中炙手可热的GAN网络。