深度通信网络专栏:基于GAN生成对抗网络的毫米波信道估计

本文地址:Generative Adversarial Estimation of Channel Covariance in Vehicular Millimeter Wave Systems

前言


深度通信网络专栏: 快速上手: 2018-2019年最新深度学习用于无线通信(物理层)的论文整理,附论文核心思想总结与代码分析。一点拙见,如有偏颇,望不吝赐教,顺颂时祺。

文章中心思想


这篇文章一脉相承自 Deep Learning Coordinated Beamforming for Highly-Mobile Millimeter Wave Systems,不同点在于前者同时做了信道估计和波束成形,而这篇文章只聚焦于信道估计。这两篇都提出,只需要一个Omni-received signal即可估计出信道,这样大大降低了训练时长。 但也因此, 导致能给到神经网络的信息微乎其微,维度很低。 然而作者联想到了GAN从低维数据恢复出高维数据的能力,并以此提出了本文的信道估计方法。即将需要估计的信道信息看做一张2D图片,从而通过GAN的方法来处理。 这个方法,显然在通信的许多问题中,会有其应用的前景。

系统模型


在这里插入图片描述
本文考虑的场景比较神奇, 是多个基站同时为一个高速运动的用户进行服务。 这与他们的前作Deep Learning Coordinated Beamforming for Highly-Mobile Millimeter Wave Systems是相同的。 可想而知,应该是提出的算法比较有局限性,因此选用了一种能将其优势体现的淋漓尽致的场景。因此,本文要考虑的是通过上行信道传输的pilot,来估计信道信息。作者假定了User端(发送端)天线数为1, 而接收端为多天线并进行了波束成形。

信道模型

首先, 作者使用了如下的宽带MISO信道模型:

h d , n = M ρ = 1 L g n , p ( d T s τ n , ) a ( θ n , ) \boldsymbol{h}_{d, n}=\sqrt{\frac{M}{\rho}} \sum_{\ell=1}^{L} g_{n, \ell} p\left(d T_{s}-\tau_{n, \ell}\right) \mathbf{a}\left(\theta_{n, \ell}\right)

一个经典的毫米波信道模型。具体可参考Frequency selective hybrid precoding for limited feedback millimeter wave systems
显然,其频域信道可表示为:
h k , n = d = 0 D 1 h d , n e j 2 π k K d \mathbf{h}_{k, n}=\sum_{d=0}^{D-1} \boldsymbol{h}_{d, n} e^{-j \frac{2 \pi k}{K} d},
基于此, 上行中BS接收到的信号可以表示为:
y k , n = w n T h k , n s k + v k y_{k, n}=\mathbf{w}_{n}^{T} \mathbf{h}_{k, n} s_{k}+v_{k}

在本文行文中,下标 n n 表示第 n n 个基站。 w n \mathbf{w}_{n} 是波束成形向量, v k v_{k} 是高斯噪声。

网络相关

另外一个重要的假设是作者认为所有基站之间是可以协作的,也引出了本文网络的目标:

  • 通过所有基站上收到的pilot, 估计信道。因此,输入向量可写为 y = [ y 1 , 1 ,   , y K , 1 , y 1 , 2 ,   , y K , 2 ,   , y K , N ] T \mathbf{y}=\left[y_{1,1}, \cdots, y_{K, 1}, y_{1,2}, \cdots, y_{K, 2}, \cdots, y_{K, N}\right]^{T}
    也就是所有基站所有子载波上的一个pilot的结合。
    如同在Deep Learning Coordinated Beamforming for Highly-Mobile Millimeter Wave Systems提出的一样,这篇文章沿用了 **Omni-antenna patterns:

In [1], the authors showed that when the uplink training pilots are received simultaneously by multiple distributed basestations using omni or quasi-omni antenna patterns, these omni-received signals draw a rich multipath signature for the user location and its interaction with the surrounding environment.

简单概述下,这个omni-antenna pattern事实上就是,将接收波束成形向量( receive beamformer or combiner) 置为:
w n = [ 1 , 0 , , 0 ] , n \mathbf{w}_{n}=[1,0, \dots, 0], \forall n
作者认为有两个重要优点:

  • 不需要设计接受波束成形向量了,很方便。
  • 这个omni-antenna pattern事实上包含了信道各个方向的信息,而不像传统的特定接收波束成形向量往往对准的是一个方向。也因此,作者认为每个子载波只需要一个omni-received signal就足够估计信道了。如果这一结果成立,显然是信道估计的重大突破。

稀疏变换

作者很快指出,想只用这么点数据估计信道实在太难。 因此他进行了一些转换。首先,他将目标改为,估计信道的协方差矩阵。 即:
R h n = E [ h k , n h k , n H ] \mathbf{R}_{\mathbf{h}_{n}}=\mathbb{E}\left[\mathbf{h}_{k, n} \mathbf{h}_{k, n}^{H}\right]
然后,利用毫米波信道稀疏的特性,将其进行稀疏分解,即
h d , n = U B S g d , n \boldsymbol{h}_{d, n}=\mathbf{U}_{\mathrm{BS}} \boldsymbol{g}_{d, n}
U B S \mathbf{U}_{\mathrm{BS}} 是DFT矩阵。 由于空间中路径数十分有限,因此 g d , n \boldsymbol{g}_{d, n} 中绝大部分元素都为0。(这一部分看不懂的同学可以查阅下作者给出的引文《An Overview of Signal Processing Techniques for Millimeter Wave MIMO Systems》)。
总之,作者将本文的目标改为稀疏矩阵 R g n \mathbf{R}_{\mathrm{g}_{n}} (文中称为 虚拟信道协方差
R h n = U B S R g n U B S H \mathbf{R}_{\mathbf{h}_{n}}=\mathbf{U}_{\mathrm{BS}} \mathbf{R}_{\mathrm{g}_{n}} \mathbf{U}_{\mathrm{BS}}^{H}
由于篇幅原因,这里的一些推导建议大家查看原文,但是对于大致理解这篇文章来说,只需要知道作者将一个信道估计的问题,转变为估计一个稀疏矩阵,以此来降低GAN的难度。正如作者原文所说:

it is much easier to learn the mapping from the omni-received uplink signature y to the virtual channel covariance matrices as compared to the original channel covariance matrix.

网络模型

在这里插入图片描述
如图,作者使用了经典的GAN网络模型, 上方为生成器,下方为判别器。生成器的任务是:

  • 通过导频序列,生成 R g n \mathbf{R}_{\mathrm{g}_{n}} 。 可以理解为导频通过神经网络,输出了信道预测值。
    本文和其他许多基于深度学习的信道估计文章不同, 其他文章往往以准确信道信息为标签,并计算网络输出值与真实值的MSE作为loss,不断训练网络缩小loss, 而本文则是通过GAN的方式来完成训练:
    min G max D L ( G , D ) = E R ε n [ log D ( R g n y ) ] + E z [ log ( 1 D ( G ( z y ) ) ) ] \begin{aligned} \min _{G} \max _{D} L(G, D) =\mathbb{E}_{\mathbf{R}_{\mathbf{\varepsilon}_{n}}}\left[\log D\left(\mathbf{R}_{\mathbf{g}_{n}} | \mathbf{y}\right)\right] +\mathbb{E}_{\mathbf{z}}[\log (1-D(G(\mathbf{z} | \mathbf{y})))] \end{aligned}
    这是GAN的经典公式: 先固定生成器G, 训练最优的判别器D来区分真实样本和生成样本。 在这里,分别代表了 真实信道信息和估计(生成)的信道信息。 然后,固定判别器D, 训练生成器,使得估计的信道信息尽可能贴近于真实信道信息。 来回迭代,直至收敛。
    GAN相关的推导可以参考这里 G ( z y ) ) G(\mathbf{z} | \mathbf{y})) 表示在接收的导频序列为 y \mathbf{y} 的情况下,通过噪声 z \mathbf{z} 生成(估计)的 R g n \mathbf{R}_{\mathbf{g}_{n}} , 也可以表示为 R ^ g n = G ( z , y ) \hat{\mathbf{R}}_{\mathbf{g}_{n}}=G(\mathbf{z}, \mathbf{y})

作者指出,由于所需要估计的信道信息的维度远大于输入的训练序列维度。 因此,普通的DNN网络很难胜任 (可以解释为什么作者没有沿用以MSE为loss反向传播训练一个网络)。 而GAN,从低精度图片恢复出高分辨率的图片启发了作者,让他想到使用GAN,从低维度的接收信号去恢复信道信息。

具体网络设计:


生成器

生成器的具体结构展示在上图的上半部分。 在传统的GAN中, 生成器往往接收一组随机数(如:高斯噪声),通过训练生成想要的图片类型。 但这里我们还需要考虑的是必须要给网络训练信息。因此,作者采用的思路是产生一个 100 × 1 100\times1 的服从标准高斯分布的 z \mathbf{z} 噪声向量。 然后将 z \mathbf{z} 与导频序列 y \mathbf{y} 拼接后,通过三层反卷积神经网络(参考),最后得到一个 2 × 32 × 32 2\times32\times32 (假设天线数为32))的实数矩阵,其中第一维的 2 2 代表实部和虚部。 由于作者没有给出具体的代码,文章中也没有过多介绍,只能依靠给出的图片复现。

判别器

判别器的过程则是生成器的反向。 重点在于经过两层卷积网络后, 作者将导频序列与输出结果拼接, 再通过最后一层神经网络,然后输出0或1. 这个拼接的网络又被称为conditioned CNN layer。 个人认为这一步是必不可少的。 我们的目标是根据导频序列估计出信道,那么判别器的目标就是 输入信道,判别他是不是由这串导频序列得到的

仿真结果


由于是信道估计问题,所以仿真也很好做,即:
N M S E = R ^ g n R g n F 2 R g n F 2 \mathrm{NMSE}=\frac{\left\|\hat{\mathbf{R}}_{\mathrm{g}_{\mathrm{n}}}-\mathbf{R}_{\mathrm{g}_{\mathrm{n}}}\right\|_{\mathrm{F}}^{2}}{\left\|\mathbf{R}_{\mathrm{g}_{\mathrm{n}}}\right\|_{\mathrm{F}}^{2}}
通过归一化的偏差来衡量信道估计的准确度。
在这里插入图片描述
由于这个信道估计的方法过于特殊,加上非常另类的系统模型,作者直接没有给出任何对比算法。所有的仿真结果可以说是在自娱自乐,不太具有意义。 加上仿真代码并未给出, 这个方法的实用价值确实有待商榷。
但无论如何,这为深度通信网络打开了另一种思路,即结合当今深度学习中炙手可热的GAN网络

发布了43 篇原创文章 · 获赞 85 · 访问量 72万+

猜你喜欢

转载自blog.csdn.net/weixin_39274659/article/details/89409470