A Joint Learning and Communications Framework for Federated Learning over Wireless Networks

无线网络上联邦学习的联合学习与通信框架

这篇文献讨论了一种用于无线网络上的联合学习的学习和通信框架。联合学习是一种分布式机器学习方法，其中多个设备共同训练一个模型，而不需要将原始数据传输到中央服务器。这种方法在保护用户隐私的同时，也减少了网络带宽和计算资源的需求。

该框架提出了一种联合学习和通信的结合方法，通过优化学习和通信的资源分配，提高了联合学习的性能。具体来说，该框架考虑了以下几个方面：

1. 联合学习任务的划分和资源分配：将联合学习任务划分为多个子任务，并根据设备之间的通信质量和计算资源，动态分配任务给不同的设备。这样可以根据设备的能力和网络条件，实现更高效的学习过程。

2. 联合学习和通信的协同设计：在传输学习模型参数的同时，考虑通信资源的有限性。通过将学习和通信过程进行协同设计，可以在保证学习性能的同时，减少通信开销。

3. 通信策略的优化：针对不同的网络条件和设备特点，设计了一种优化的通信策略。通过动态调整通信方式和传输参数，可以最大程度地提高联合学习的性能。

总之，这篇文献提出了一种联合学习和通信的框架，旨在提高在无线网络上的联合学习性能。通过优化学习和通信资源的分配，可以更好地适应不同的网络条件和设备特点，从而实现更高效的联合学习过程。

联合学习和联邦学习在概念和实现方式上有以下主要区别：

1. 数据位置

- 联合学习需要将所有数据发送到中心服务器进行训练，数据离开原始数据所有者的设备。

- 联邦学习保留所有数据停留在各个数据所有者本地，只进行模型参数或加密后的特征交换，不会共享敏感数据。

2. 隐私保护

- 联合学习无法保证数据的隐私性，中心服务器可以访问所有明文数据。

- 联邦学习可以很好地保护数据的隐私，各方只交换加密后的数据，无法恢复原始数据。

3. 计算效率

- 联合学习计算效率高，但通信开销大，随数据量线性增长。

- 联邦学习计算分散在各节点，通信更高效，但单次迭代计算效率较低。

4. 适用场景

- 联合学习适用于数据所有权分散但允许共享的场景。

- 联邦学习更适用于数据所有权分散且隐私敏感的场景，如不同医院的医疗数据。

所以总结来说，联合学习强调计算效率，联邦学习强调数据隐私保护。联合学习适用于数据可以共享的场景，联邦学习更适用于数据隐私很重要的场景。两者在实现方法和优势方面有明显差异。

问题----为了在无线网络上训练FL算法，用户必须在无线链路上传输训练参数，由于无线资源(如带宽和功率)有限和无线链路固有的不可靠性，这可能会引入训练误差。

动机----本文的主要贡献是，通过联合考虑FL和无线度量和因素，为在无线网络上实现FL算法提供了一个新的框架。据我们所知，这是第一个对FL算法的性能和底层无线网络之间的联系进行全面研究的工作。在开发的联合通信和FL模型中，基站必须优化其资源分配，用户必须优化其发射功率分配，以降低每个用户的包错误率，从而提高FL性能。为此，我们将FL的联合资源分配和用户选择问题表述为一个优化问题，其目标是在满足延迟和能耗要求的同时使训练损失最小化。因此，我们的框架共同考虑了学习和无线网络指标。（也就是说在这里既考虑了在学习中减少误差，又考虑了在无线网络这一部分减少误差。）

方法----为了解决这一问题，我们首先推导出FL算法的期望收敛率的封闭表达式，从而建立包错误率与FL算法性能之间的显式关系。基于这种关系，优化问题可以简化为一个混合整数非线性规划问题。为了解决这一简化问题，我们首先求出给定用户选择和资源块分配下的最优发射功率。然后，我们将原来的优化问题转化为一个二部匹配问题，并使用匈牙利算法求解，该算法找到最优的、FL感知的用户选择和RB分配策略。通过适当设置学习率和选择参与FL的用户数量，可以减少传输误差对FL算法的影响，保证FL的收敛性。

仿真结果表明，发射功率、RB（资源块）分配和用户数将共同影响无线网络中FL的性能

与随机资源分配的最优用户选择算法、随机用户选择和资源分配的标准FL算法，以及一种无线优化算法相比，考虑无线因素的FL算法，以及一种无线优化算法的识别准确率分别提高了1.4%、3.5%和4.1%。

RB是什么？正交频分多址(OFDMA)技术？

这抓住了一个事实，即FL算法的目的是使用户和BS能够在没有数据传输的情况下学习最优的全局FL模型。然后，用户将他们的本地FL模型发送给BS以更新全局FL模型。

采用循环冗余校验(CRC)机制对接收到的本地FL模型进行数据错误校验，在考虑的系统中，只要接收到的局部FL模型包含错误，BS就不会使用它来更新全局FL模型。相反，BS将直接使用剩余的正确的局部FL模型来更新全局FL模型。

在我们的网络中，每个用户的能耗由两个目的所需的能量组成:a)本地FL模型的传输和b)本地FL模型的训练。为了在现实世界网络中实现FL算法，无线网络必须提供低能耗和延迟以及高度可靠的数据传输。FL算法的损失函数取决于资源分配和发射功率。

发送功率和资源分配决定了包错误率，从而影响全局FL模型的更新。因此，(11)中FL算法的损失函数取决于资源分配和发射功率。此外，由(11c)可知，为了执行FL算法，用户必须满足特定的延迟要求。特别是在FL算法中，BS必须等待接收到每个用户的本地模型后才能更新其全局FL模型。因此，传输延迟在FL表现中起着关键的作用。

在实际的FL算法中，希望所有用户同时将其本地FL模型传输到BS。由(11d)可知，要执行FL算法，在整个FL迭代过程中，给定用户必须有足够的能量来传输和更新局部FL模型。如果这个给定的用户没有足够的能量，BS应该选择这个用户参与FL过程。因此，为了在现实网络中实现FL算法，无线网络必须提供低能耗和低延迟，以及高可靠的数据传输。

A Joint Learning and Communications Framework for Federated Learning over Wireless Networks

无线网络上联邦学习的联合学习与通信框架

猜你喜欢