区块链与联邦学习综述

区块链与联邦学习综述

本期分享的论文是由Dinh C. Nguyen等人在2021年发表在IEEE Internet of Things Journal的文章《Federated Learning Meets Blockchain in Edge Computing Opportunities and Challenges》。

一、摘要

移动边缘计算(Mobile edge computing,MEC)用来处理来自无处不在的移动设备的大量数据,以便在人工智能(AI)的帮助下实现智能服务。传统上,AI技术通常需要在单个实体中进行集中数据收集和训练,但是MEC服务器由于数据隐私问题和大数据量通信开销无法计算。基于上述背景提出联邦学习(FL)通过协调多个移动设备联合训练AI模型,而无需泄露本地的数据。

为了提高安全性和联邦学习的可扩展性,区块链的分布式账本技术可以很好的代替联邦学习的中心服务器。特别当blockchain和FL结合形成的新范式FLchain,可以转换MEC网络成为分布式的,安全和隐私增强的系统。本文总结了MEC网络中的FLchain的基本概念和发展方向,讨论了FLchain的主流问题,包括通信开销,资源分配,奖励机制和隐私保护。

二、引言

现代生活中,智能手机、笔记本电脑和平板电脑等移动设备的感知和计算能力无处不在。为了适应人工智能服务对计算和存储的需求,提出了移动边缘计算(MEC)。随着物联网数据量的不断增加以及对下一代无线网络中数据隐私的日益关注,在中央服务器上实施集中式人工智能训练可能不再合适。联邦学习(FL)最近已成为一种分布式人工智能方法,通过协调多个设备来执行人工智能训练,而无需共享原始数据以增强隐私和节省网络资源。

然而,目前的FL系统仍然存在一些问题。

  1. 用户需要完全信任MEC服务器进行模型聚合,但在现实的无线网络中并不总是能够做到这一点。
  2. 尽管FL有助于增强用户隐私,但将学习参数传输到MEC服务器容易受到安全瓶颈的影响,例如恶意威胁,这些威胁可能会修改或窃取本地更新的信息[5]。此外,一旦服务器受到攻击,MEC服务器对模型聚合的依赖将引入单点故障瓶颈,从而中断整个FL系统。
  3. 考虑到现代边缘计算网络的高可扩展性,单个MEC服务器无法聚合从数百万设备上传的所有更新。因此,迫切需要在不使用中央服务器的情况下开发更分散的FL方法,以解决安全性和可扩展性问题,从而实现下一代智能边缘网络。

区块链作为账本技术[6]可以为基于FL的智能边缘计算提供解决方案,因为它具有分布式、不变性和可追溯性等特点。区块链是由共识机制(例如工作证明(PoW))控制下的散列值链接的区块的一种形式,矿工利用数字签名挖掘区块,使链接区块不受修改和变更的影响。通过使用区块链,FL可以通过分散的数据分类账来实现,而无需任何中央服务器来降低单点故障的风险,所有网络实体以透明的方式跟踪任何更新事件和用户行为。此外,可以通过事务日志轻松跟踪在训练过程中修改或更新模型参数的来源,这在传统FL系统中是无法满足的。因此,FL和区块链的整合创造了一种称为FLchain的新范式,它潜在地改变了具有分散和安全性质的智能边缘网络。

在FLchain中,每个设备都可以作为一个客户端,以分散的方式更新和聚合学习模型。每个客户端首先初始化一个数据模型并计算学习参数。然后,它以事务的形式将计算出的模型更新上传给一组矿工。挖掘者在一段时间后将客户端创建的事务(包含本地更新)合并到一个区块中,然后由挖掘者通过挖掘过程进行验证。一旦区块被挖掘,它将被附加到区块链并广播到整个网络。每个客户端下载最新更新的区块,并计算全局模型的新版本。迭代该过程,直到全局损失函数收敛或达到所需精度。通过这种方式,区块链有助于消除对中央服务器的需求,从而潜在地降低通信成本并实现更好的智能网络可扩展性。此外,区块链通过不可变的区块分类账为FL训练提供了高安全性。

本文主要贡献如下:

  1. 概述了FL和blockchain的基本原理,提出用于边缘计算的通用框架FLchain
  2. 讨论了FLchain中的关键技术问题,包括通信开销,资源分配,奖励机制和隐私保护
  3. 分析了FLchain在边缘计算的机遇和可能的应用领域,例如边缘数据共享,边缘内容缓存和边缘众感知。
  4. 讨论了FLchain的关键挑战和未来的发展方向。

三、联邦学习-FL

自2016年提出以来,FL通过在网络边缘与多个移动设备合作提供分布式AI解决方案,改变了许多应用。

FL不是将所有原始数据上传到云服务器或者集中数据训练AI模型,而是通过将AI模型训练过程直接分配到本地设备来实现分布式学习,以在服务器端(例如,基站(BS)或接入点(AP)的MEC服务器)上构建共享全局模型。

随着移动硬件的最新发展和对用户隐私的日益关注,FL对于各种智能边缘服务(如智能交通和智能医疗)尤其具有吸引力。

例如,在智能车辆网络中,车辆可以充当学习客户端来训练本地模型,并与路边单元(RSU)协作来构建交通预测模型,旨在构建一个全面的车辆路线图以减少交通拥堵。

由于基站无法从分布式移动设备收集所有数据用于AI/ML训练,FL对于在下一代移动边缘网络中实现完全智能化至关重要。FL允许设备和BS训练通用模型,同时原始数据集保存在数据所在的用户本地。

如图所示为经典的FL架构,包括分布式设备和聚合服务器,运行流程可以分为4个步骤:

  1. 服务器上的MEC服务器首先选择计算任务(例如车辆交通分析),以及任务要求(分类任务或回归任务),以及学习参数(学习率等)。然后,MEC服务器选择设备子集作为协作训练的学习客户端。实际上,MEC服务器可以通过使用合适的客户端调度机制在不同的更新轮中选择不同的设备子集,以提高其训练质量。

  2. 服务器初始化global model并将其发送给所有客户端,以创建新一轮训练。在这里,每个客户机使用自己的数据集训练模型local model,并计算新的更新。

  3. 每个客户端将其local model的上传到MEC服务器进行全局聚合。通过聚合来自客户端的所有模型,服务器以最小化损失函数的方式构建了一个新的全局模型global model。

  4. 务器将计算出的全局模型广播给所有客户端,以便进行下一轮训练。迭代上述过程,直到全局损失函数收敛或达到所需精度。

四、区块链-blockchain

4.1 区块链基础

区块链本质上是一个在点对点(P2P)网络上运行的公共、可信和共享的分布式账本。

区块链概念背后的关键思想是去中心化,即区块链上的数据不受任何单一实体的控制。相反,所有区块链节点(如边缘网络中的移动设备和MEC服务器)都有同等权利验证和管理由共识机制启用的区块链中存储的数据。

这种分散功能使区块链能够抵御数据修改或攻击。此外,去除中央服务器避免了单点故障的风险,从而提高了区块链系统的可靠性和稳定性。

上图描述了典型的区块链操作,主要包括3个步骤:

  1. 移动用户使用其钱包账户(包括私钥和公钥)创建具有元数据(即用户ID)、用户签名和时间戳的交易。由于移动设备的资源限制,包括挖掘在内的大量计算任务,智能合约执行可以在云计算上组织和实施。然后,用户向云计算服务器提交特定请求的事务,例如物联网数据任务处理、用户身份验证、云服务查询等。

  2. 云服务器发布可用资源并处理用户的请求。智能合约自动执行交易身份验证、用户验证和交易(即用户和服务提供商之间的资产交易)。此外,云服务器授权区块链矿工(即虚拟机)验证用户交易。该事务被添加到未确认事务池中,等待矿工提取该事务。虚拟矿工网络可以通过协商一致的机制(如PoW)达成协议。

  3. 最快验证区块的矿工会将签名发送给其他矿工进行验证。如果所有矿工达成协议,则验证区块及其签名将按时间顺序附加到区块链。最后,所有网络实体接收该块并同步区块链的副本。

区块链的运营也会产生延迟和能耗方面的成本。事实上,区块链挖掘任务的执行,例如区块验证和矿工之间的信息交换,需要消耗大量能源。为了将新交易附加到区块链,区块链用户或矿工需要运行一个挖掘谜题,例如PoW,它通常很复杂,需要大量的计算和存储资源。在移动区块链网络中,这一问题变得更加重要,移动设备的电池和内存通常有限,这使得它们很难适应所有挖掘任务。此外,采矿组矿工之间的重复信息交换也需要大量带宽资源,并导致高通信延迟,这可能会降低FLchain训练的整体性能,例如延迟模型聚合。

4.2 区块链类别

区块链可分为三种主要类型,包括公共链(或无许可)、私人链(或许可)和联盟链。

  • 公共链

    公共链是一个开放的网络,允许每个人加入并进行交易,以及参与共识过程。最著名的公共区块链包括比特币和以太坊,以及开源和智能合约区块链平台。例如,以太坊是一个分布式公共区块链网络,类似于比特币等大多数平台。以太坊的一大优势是通过在以太坊虚拟机上运行的智能合约实现自动数字资产管理的能力。区块通过矿工管理的PoW算法验证并附加到区块链,以在网络中的所有节点之间实现安全、防篡改的共识。每个区块都需要消耗一定数量的gas(以太坊的货币),作为其执行的一部分,并为采矿者支付开采区块的报酬。

  • 私人链

    私人链是一个由权威机构管理的仅限邀请的网络,区块链中的所有活动(如交易写入和检索)都需要通过验证机制进行许可。私有区块链假设网络由单个实体运营,而联盟区块链则在一组所有者的管理下运营。它们限制用户访问网络和网络成员执行的事务。由于能够在网络中提供协作控制,联盟区块链能够实现组织间的互联业务转型和创新商业模式。

  • 联盟链

    联盟链是一个由多个组织共同管理的区块链平台。Hyperledger Fabric是一个受欢迎的区块链联盟平台。RealDealGeFaby是由Linux基金会在2015创建的财团BuffClinux平台。与其他区块链技术类似,Hyperledger Fabric有一个账本,使用称为链码的智能合约,并协调交易组织中的参与者。然而,管理网络访问的概念是不同的。Hyperledger结构网络的成员必须得到会员服务提供商的信任,而不是允许网络中所有成员参与的开放式无权限系统。Fabric采用了一种新的体系结构方法,改进了区块链应对不确定性、资源消耗和性能攻击的方式。Fabric还可以创建通道,使一组参与者能够建立单独的交易分类账。为了在网络中达成共识,Fabric使用拜占庭容错(PBFT),这非常适合于成员部分受信任的企业联盟。

五、FL和blockchain为什么要结合

5.1 威胁模型和安全需求

威胁模型

  1. 内部威胁

    在FLchain系统中,MEC服务器在训练过程中假设是半诚实的。在此假设下,MEC服务器遵守规则训练,但对其他方参数更新好奇,因此可以从区块链上的交易中推断出一些敏感信息。更具体地说,尽管数据没有以原始格式显式共享,但好奇的MEC服务器仍有可能从梯度中窃取训练数据并大致重建原始数据,尤其是在架构和参数没有完全保护的情况下。此外,恶意客户端可以利用和学习数据结构,如从全局模型更新中提取的图像像素,而无需征得其他客户端和MEC服务器的同意。

  2. 外部威胁

    在客户端,对手可以修改数据特征或在原始数据集中注入不正确的数据子集,以将后门嵌入模型,从而改变本地客户的训练目标。攻击者还可以破坏某些客户端设备,并且攻击者在学习过程中操纵受损客户端设备上的本地模型参数,从而导致全局模型更新出错。此外,对手可以在FL训练期间在无线通信信道上部署攻击,以获取客户的个人信息。例如,对手可以检索混合在参数更新包中的敏感用户信息,如年龄和用户偏好。此外,外部窃听者可以获得对MEC服务器的未经授权的访问,以便控制模型更新聚合过程。

安全需求

  1. 重要的是为FL训练提供高度的隐私保护,以确保数据信息安全并鼓励用户参与数据训练。这可以通过使用微扰技术来实现,例如差分隐私技术可以用来保护训练数据集,防止数据泄露。
  2. 需要威胁管理和攻击防御解决方案来解决客户端和MEC服务器端的安全问题。例如,需要在聚合服务器上部署攻击检测机制,以评估每个客户端的权重贡献,目的是过滤掉敌对客户端,并在每个通信回合中检测攻击,如模型更新中毒攻击、数据中毒攻击和规避攻击。
  3. 在参数交换和更新广播过程中,保证无线通信信道的安全性和隐私性是非常必要的。使用区块链和智能合约的数据加密、通信身份验证和安全账本配置是满足FL通信中这些安全要求的有用解决方案。
  4. FLchain系统中的移动设备能够建立事务并与相关MEC服务器通信,以进行安全的FLchain训练。每个设备还应投入资源(如存储和计算)来训练学习模型和运行挖掘以获得额外利润。

5.2 FL和blockchain结合

区块链凭借其独特的特性,在边缘网络中提高FL的安全性方面具有巨大的潜力。

  1. 使用分散的区块链可以消除FL训练中对中央服务器的需求。相反,一个共享的不可变账本用于聚合全局模型,并将全局更新分发给学习客户端,以便在设备上进行直接计算。模型聚合的非集中化不仅降低了单点故障的风险,从而提高了训练可靠性,而且还降低了在全局模型聚合中对中央服务器造成的负担,尤其是在边缘网络具有多个客户端时。学习更新被附加到不可变的块中,用于在训练期间在客户端之间进行信息交换,从而确保针对外部攻击的训练的高安全性。将区块复制到整个网络还允许所有客户端验证和跟踪训练进度,以确保FLchain系统的高度信任和透明度。
  2. 消除FLchain模型聚合的中央服务器可能会降低通信成本,并吸引更多移动用户参与基于其分散网络拓扑的数据训练,从而提高移动边缘网络的可扩展性。

六、联邦区块链架构-FLchain

从经典联邦学习架构训练过程中,我们可以看到,FL依赖于集中式服务器,即MEC服务器进行模型聚合,这在无处不在的无线网络中存在故障和可伸缩性问题。此外,这种集中式FL架构无法吸引远离服务器的设备进行训练,从而限制了整个系统的学习性能。

一个替代方案是,FLchain通过将全局模型计算直接分配到每个设备上而不需要任何集中式服务器。FLchain为不可变区块链提供的FL训练过程提供了独特的安全功能,从而实现了可靠的智能分散边缘网络。FLchain架构如上图所示,包括一组MEC服务器和连接区块链网络中的分布式设备。由于高计算能力,MEC服务器通常被选择执行挖掘任务以维护区块链网络,而移动设备可以参与本地训练或挖掘,或者同时执行训练和挖掘任务。FLchain程序包括以下几个步骤:

  1. 一组MEC服务器使用其关联设备初始化,用于边缘网络中的特定学习任务(例如联邦医疗分析)。每个MEC服务器作为一个学习客户端,将其资源用于运行区块链共识(或挖掘),本地移动设备运行FL训练算法。

  2. 每个训练节点使用自己的数据计算本地模型,然后通过创建事务将本地模型通过区块链传输到其关联的MEC服务器。

  3. MEC服务器从其客户机收集事务,并根据定义的数据结构(例如Merkle树)存储它们,然后在特定时间段创建一个块。每个块都由一个唯一的散列值以及一个时间戳和一个nonce标识,其目的是防止未经授权的块复制。然后,MEC服务器参与挖掘过程(例如PoW),以验证新创建的块,并在所有MEC服务器之间达成共识。可以选择MEC服务器作为管理器,在其时间段内协调挖掘过程。此外,设备还作为全部或部分节点参与挖掘区块,以获得额外利润。

  4. 挖掘完成后,验证的块被添加到区块链中,并通过服务器设备通信广播到所有本地设备。现在,本地模型更新安全地存储在区块链中。

  5. 本地设备下载包含其他设备的所有本地更新的块。这允许每个设备根据预定义的模型聚合规则(如加权和规则或基于错误的聚合规则)直接在本地设备上计算全局模型。换句话说,全局模型是在本地计算的,而不是像传统的FL体系结构那样在中央服务器中计算的。迭代训练过程,直到全局损失函数收敛或达到所需精度。

在FLchain训练中,训练样本可能不是完全确定的。例如,在联邦图像分类任务中,客户端可能具有不同的图像数据集,这些图像数据集具有不同的像素分辨率,也可以通过传感环境进行连续更新。同时,区块链中的交易存储需要精确的内容匹配,其中交易的哈希值必须是其内容的唯一值。

所以在FLchain训练期间,如何实现训练数据和区块链存储之间的同步是一个重要问题。一种可能的解决方案是针对模型交换期间的不同训练示例开发自适应哈希值生成机制,例如,在数据块公式中连续重新配置其操作哈希参数,这有助于实现稳定可靠的区块链存储和操作。

通过使用区块链,FLchain由于其分散的网络拓扑结构,可以在学习过程中吸引更多的设备以获得更好的可扩展性。特别是关于学习更新的信息以不变的区块形式是安全的,这提高了边缘网络中训练的安全性。FLchain以其分散和安全的性质,有望为实现智能和可扩展的边缘网络提供具有安全保障的有吸引力的解决方案。

下表总结了经典FL和FLchain之间的比较。除了优点外,FLchain还存在一些缺点,例如区块链挖掘、资源管理和好奇矿工的安全可能带来的延迟,这些都需要在系统设计中加以考虑。

优势 缺点 执行环境
classical FL •能够在本地设备上训练AI模型,而无需共享原始数据
•增强用户数据隐私保护
•节省网络资源,例如带宽,发射功率等。
•仍然存在安全问题(例如,数据攻击、单点故障)
•远程设备与服务器的通信延迟高。
•模型汇总不透明,缺乏激励机制。
•所有设备和服务器都需要为协作训练建立可靠的通信。
•学习客户端或设备需要信任中央服务器。
FLchain •不需要中央服务器
•消除单点故障风险
•可以在设备和服务器之间建立信任
•提高边缘网络的可扩展性
•区块链挖掘可能需要的延迟和能源成本。
•开放式更新共享可能带来的隐私风险。
•训练数据和区块链存储之间可能存在冲突。
•移动设备能够训练学习模型并运行挖掘以获得额外利润
•FLchain中使用的区块链平台能够在所有移动设备之间建立分散的数据网络,用于共享训练。

七、FLchain的设计和用例

在本节中,根据最近与联邦区块链集成相关的工作,介绍边缘计算中FLchain的设计和关键用例。我们涵盖了FLchain设计中的四个关键领域,包括通信成本、资源分配、激励机制、安全和隐私保护。在每一个领域中,都会提出问题陈述,并讨论一些关键用例。然后,总结了最重要的设计特征的主要经验教训,并强调了进一步研究的前景。

7.1 通信开销

1、问题描述

在FLchain中,每个客户端通过运行在边缘网络顶部的区块链账本计算和更新本地模型,并且在本地设备上执行全局模型聚合,而无需中央服务器。尽管消除了与中央服务器通信造成的网络成本(例如延迟),但区块链的使用引入了与区块挖掘相关的新成本。因此,FLchain的延迟公式需要考虑设备训练延迟、更新通信延迟和块挖掘延迟以及训练准确性感知。

2、用例

论文《Blockchained On-Device Federated Learning》中的工作是首次尝试对FLchain中的通信成本进行整体分析。在这里,MEC服务器通过对接收到的本地更新执行交叉验证,充当既参与训练又进行挖矿的矿工。为了生成块,矿工们合作解决PoW问题,直到他们找到一个nonce值或从其他矿工那里收到生成的块。

通过在通信阶段使用加性高斯白噪声信道模型和在挖掘阶段使用区块传播延迟模型,建立了每轮通信中计算、通信和区块生成延迟的集成框架。最终目标是找到一个最佳的块生成速率,最小化PoW过程产生的平均延迟,同时避免在块生成阶段由于不正确的全局更新而导致分叉的可能性。

与经典FL方法相比,FLchain在不同模拟设置下实现了更低的系统延迟和更好的学习精度。《Federated Learning With Blockchain for Autonomous Vehicles: Analysis and Design Challenges》中的另一项研究对车辆网络中的FLchain进行通信成本分析,如图4所示:

区块链的使用可能有助于克服集中故障问题,并通过奖励机制吸引不可信的车辆来提高FL训练性能,从而增强智能车辆网络的可扩展性。在这种情况下,每辆车都充当FL客户,通过区块链网络中的矿工进行本地训练并与其他车辆进行交流。更具体地说,车辆及其相关矿工的FL训练和模型更新延迟通过共同考虑模型计算、模型卸载和区块链挖掘如下:
T n = τ out  + T g 1 − p fork  + τ global  + τ g d n T_{n}=\frac{\tau_{\text {out }}+\mathcal{T}_{g}}{1-p_{\text {fork }}}+\tau_{\text {global }}+\tau_{g d n} Tn=1pfork τout +Tg+τglobal +τgdn
这里, τ o u t \tau_{out } τout是PoW过程中本地更新转储的超时, T g \mathcal{T}_{g} Tg是块到达/生成延迟, p f o r k p_{fork } pfork是分叉概率, τ g l o b a l \tau_{global } τglobal τ g d n \tau_{g d n} τgdn分别是全局模型更新和全局模型下载的延迟。然后,根据不同信道条件下的传输帧大小、块大小和块到达率,通过在线延迟最小化算法优化延迟。仿真结果揭示了联合考虑通信延迟和一致性延迟在实现最优FLchain训练延迟方面的好处,以及区块链参数(例如区块到达率)对整体模型学习性能的积极影响。

3、经验和展望

  • 通信成本是在实际部署FLchain系统之前需要解决的关键问题。当前大多数FLchain方案通过考虑设备训练延迟、与矿工的通信延迟以及挖掘延迟来分析通信成本[27-28],而[29]中的工作主要关注边缘计算延迟和参数传输通信延迟。

  • 可以采用一些解决方案来降低通信成本,例如基于奖励的训练[28]和根据学习精度和带宽资源约束调整块到达率[29]。

  • 大多数当前解决方案[27]、[28]依赖于PoW共识机制,这通常需要大量带宽和能源来实施采矿过程。因此,应考虑开发轻量级区块链,以促进FLchain,旨在增强用户的训练体验并降低系统成本。

7.2 资源分配

1、问题描述

资源分配对于支持FLchain的运营非常重要。在客户端,当设备需要为数据训练和区块链参与共享其计算和存储资源时。在MEC服务器端,还需要进行资源管理,以确保以最小分叉概率将包含本地更新的块附加到区块链的方式进行有效挖掘。

2、用例

论文《Resource Management for Blockchain-enabled Federated Learning: A Deep Reinforcement Learning Approach》中的工作为FLchain提出了一种基于DRL的资源分配策略,以解决联邦数据训练中的两个关键问题,包括块挖掘导致的延迟增加和用于本地训练的移动设备的资源限制。

为了克服这些挑战,服务器(例如,BS)和移动设备之间的更新通信被表示为 M / M / c M/M/c M/M/c队列模型,其中 M M M表示泊松到达和指数服务过程, c c c表示服务节点的数量。例如,在FLchain通信中,新事务在被追加到块之前存储在队列中,挖掘赢家是负责运行PoW谜题的服务节点。通过使用马尔可夫过程,根据上行链路和下行链路带宽资源约束,以最小化能量消耗和训练延迟,同时最大化模型准确率的方式导出奖励函数。实验证明了该算法的有效性,与贪婪算法相比,该算法可以降低高达72%的能量消耗。

DRL在[41]中还用于资源分配,允许模型所有者在事先不知道能量水平和用户移动性不确定性的情况下,找到关于能量和通道的最佳决策,以执行训练。提出了一个模型所有者的随机优化问题来最大化通信轮数,同时最小化能量和信道带宽的资源使用。行动策略的使用允许模型所有者确定应使用哪个渠道将全局FL模型传输给客户,并估计应释放多少能源以最小化系统成本。最近,考虑了一种资源管理方案,以分析MEC网络中具有数字孪生的FLchain的学习精度和资源消耗之间的权衡[42]。设计了一个基于DPoS共识的轻量级区块链平台,以支持FLchain中的模型更新和区块挖掘。通过使用深度神经网络作为所有物联网用户的策略调度器来解决数据中继优化问题,还采用DRL方法来实现最佳用户和资源调度,以提高通信效率和训练性能。为了评估提议的FLchain方案的性能,在一个有100个最终用户和4个BSs的模拟环境中使用了真实世界的MNIST数据集和Fashion MNIST数据集[43]。通过仿真,DRL证明了它在为用户调度和带宽分配找到最佳解决方案方面的有效性,同时确保了在各种网络环境下可接受的学习速率。

3、经验和展望

  • 资源分配是确保FLchain数据训练的最佳资源分配的一项重要任务。大多数最先进的技术[40-41]使用DRL在能量和信道带宽可用性条件下为FLchain系统实施资源分配策略。

  • 基于DPO共识,采用了轻量级区块链平台,以支持FLchain中的模型更新和区块挖掘[42],这有可能降低FL训练的能耗。

  • 通过联合考虑块生成[44]、模型到达率和设备上学习率,可以考虑一些可能的方向来进一步改进资源分配。通过这种方式,我们可以在基于FL的智能边缘网络中实现矿工和本地设备的协作资源分配解决方案。

7.3 激励学习

1、问题描述

尽管FL在保护用户隐私的同时促进了协作学习,但它仍然面临着激励客户参与FL过程并贡献其数据和计算资源的挑战。如果没有适当的激励机制,客户可能不愿意参加数据训练,这将降低所设计的FL系统的可扩展性。最近,区块链已成为促进透明经济机制设计的一个有吸引力的工具,以促进FLchain系统中的FL训练。

2、用例

一些文献中介绍了FLchain激励学习的用例。例如,[46]中的工作为FLchain实施了严格的奖励政策设计,在移动用户的合理假设下,提供了实现预期目标的经济解决方案。其关键目标是为FLchain提供重复竞争,以便理性的用户遵循协议并最大化其经济利润。在某一轮训练中选择的每个用户都可以选择上一轮其他用户更新的模型,以通过区块链更新其模型。得票最高的用户将在下一轮学习中获得奖励。通过新的拍卖理论(如多奖竞争理论)对所提出的激励机制的效率进行了研究,显示了良好的激励相容性。

[47]中还介绍了FLchain学习的激励机制。设计了一个基于区块链的分散声誉系统,以确保在边缘计算环境中进行可信的协作模型训练。在这种情况下,区块链非常有助于解决广泛的问题,如数据安全、模型训练的中心性以及故障和妥协的集中点。为了提高全球模型训练的绩效,激励是非常必要的,以招募更多具有高质量数据源的移动用户。

[48]中的工作考虑了数据所有者、云供应商和AI开发者,在基于区块链的云计算中的不可信任AI市场中进行协作学习的FLchain方案,旨在保护隐私和资产所有权。一些系统链码功能被配置为激励所有客户在分布式账本中不可变地记录其行为,以便区块链可以验证FL训练中用户的行为。在Hyperledger Fabric区块链上与三个不同的组织建立了一个原型,每个组织都有24个对等点通过区块链执行共享AI模型训练,显示了在不同网络设置下较低的网络延迟和提高的吞吐量(例如每秒事务数)。

[49]中设计了一个分散的、可公开审核的FLchain系统,该系统具有信任和激励,以加速FL训练中的合作,而不必担心实体之间的信任。事实上,区块链有望在FL过程中安全存储训练客户端和FL模型的信息,而挖掘有助于验证FL计算中的错误更新。特别是,通过基于区块链的激励机制,对发现任何不当行为的客户进行奖励,并对受影响的训练客户端进行补偿。

为FL设计了一种价值驱动的区块链激励机制,称为DeepChain,旨在鼓励各方在协作学习期间正确行为并积极分享获得的局部梯度[50]。每一方可根据其贡献获得奖励或处罚。学习激励的好处有两方面,包括吸引更多客户加入训练,以及确保客户在本地模型训练和更新交流中诚实。此外,模型更新由区块链进行验证和审计,而梯度收集和参数更新由所有参与者通过账本网络进行监控,从而确保FL过程的公平性。

除了激励之外,FL服务器还需要在FL训练后向客户支付供款成本。为了解决这个问题,在[51]中考虑了一种支付方法,通过设计一个类抽样验证错误方案来验证客户端的梯度,以指定合理的设备奖励。智能合约集成在Hyperledger结构区块链中,以透明和可信的方式实现梯度验证和奖励计划[52]。通过这种方式,客户可以通过保留其数据的所有权和获得激励而受益,而模型所有者可以访问更大的数据集,从而增强整个外语学习的稳健性。

3、经验和展望

  • 为FLchain系统设计激励机制,已经提交了一些文献著作,其共同目标是在AI训练中吸引更多的客户和数据集,并提高整体FLchain学习的稳健性[46]、[47]、[49]。

  • 区块链提供了独特的功能(例如,分散化、可信),以便在FL训练中实现安全的激励解决方案,其中模型更新由区块链验证和审核,而梯度收集和参数更新由所有参与者通过账本网络进行监控,从而确保FL过程的公平性[50],[51]。

  • 激励过程中梯度更新的验证成本尚未考虑。在未来,重要的是分析奖励利润和系统成本之间的权衡,这对客户和模型所有者都有利,拍卖理论可以用于激励分析[53]。

7.4 安全和隐私保护

1、问题描述

为了确保FLchain系统的鲁棒性和安全性,构建安全和隐私保护机制至关重要。中毒攻击和数据隐私威胁等攻击会使FLchain系统变得脆弱和危险,尤其是在由多个设备和服务器组成的分布式边缘网络中。因此,在大规模部署FLchain之前,迫切需要开发解决安全和隐私问题的解决方案。

2、用例

在最近的工作中,已经有一些考虑了与FLchain安全保护相关的用例。[55]中的工作调查了一个FLchain系统,其中用户通过区块链网络中的边缘服务器参与协作学习并交换其本地更新,同时数据存储在分布式哈希表中。考虑了攻击模型;也就是说,对手可以尝试使用设计的伪造数据训练局部模型,并在更新传输之前替换全局模型,以操纵训练输出。通过调整区块链挖掘的难度级别,可以降低对训练数据进行中毒攻击的可能性,而不会降低训练性能。

[56]研究了基于区块链的分散安全多方学习系统。每个客户端计算并广播其本地模型,并在校准后使用自己的数据集通过区块链执行从其他客户端接收的模型。在模型广播和模型校准过程中,考虑了FLchain中的两种拜占庭攻击,这两种攻击可以通过使用链外样本挖掘和链上挖掘的合作挖掘策略来解决。

在FLchain的隐私保护方面,也提出了一些解决方案。[57]中介绍了一种基于区块链的FL架构,称为PriModChain,用于工业物联网网络,重点是模型训练和更新传输中的隐私保护。对局部生成的带有人工噪声的模型应用了一种差分隐私技术,以减少识别个人记录的可能性。通过使用智能合约,可以确保中央机构和分布式用户之间交换全局ML模型的通信安全,这有助于达成更新验证协议,并为FL更新提供透明度。此功能强制执行无偏和错误费用数据操作,从而增强FL流程针对外部数据威胁的安全性和可靠性。

在使用差分隐私的FLchain中,人工噪声旨在通过使用隐私机制(如Laplace、Duchi或分段机制)干扰训练梯度,然后再到其相关MEC服务器消除。然后,所有MEC服务器合并所有客户端的差异隐私更新,并执行一致性以生成聚合的全局梯度,然后将该梯度广播给所有参与的客户端进行下一轮训练。在全局聚合之后,单个节点无法在区块链模型交换期间反转基本事实以检索包含客户端更新的实际向量[58]。即使在客户机与其关联的MEC服务器之间的公共模型更新共享中,该服务器执行多个查询以尝试检索客户机的实际更新,客户可以通过跟踪区块链分类账日志或使用MEC网络中部署的智能合同的可追溯性来实现这种未经授权的行为[59]。

[60]中的工作为基于区块链的分布式学习提出了一个可扩展的隐私架构,通过在不受信任的学习方之间的隐私保护联盟中验证模型上的源质量和机密性。攻击可以在训练期间从一方窃取私人数据,或者尝试根据生成的梯度重建训练集。在这种情况下,可以采用差分隐私技术,以便如果输出独立于输入数据的特定数据点,则模型计算被认为是差分私有的。

3、经验和展望

  • 在FLchain中,攻击可以尝试使用设计的伪造数据训练局部模型,以替换全局模型,并在模型传输过程中修改参数值,以操纵训练输出。现有的大部分工作都集中在建立攻击检测机制,用于FLchain中的模型训练和更新传输[55]、[57]、[60]。

  • 在不降低训练性能的情况下,通过调整挖掘难度,可以降低地面攻击的可能性(例如,对训练数据的攻击)。智能合约有助于在中央机构和分布式用户之间建立安全通信,以进行安全模型更新[57]。

  • 对于隐私保护,FLchain中可采用差异隐私技术,因此,如果输出独立于输入数据的特定数据点,则模型计算被视为差异隐私[57],[60]。通过这种方式,将微分隐私应用于带有人工噪声的局部生成模型,以减少个人记录识别的可能性。在未来,需要部署更安全的空间分解算法。例如,在[61]中提出了不可行拉普拉斯噪声规定的解决方案,以解决差分隐私中拉普拉斯机制的对称分布问题。这样,通过将拉普拉斯噪声相乘,将不可行噪声添加到私有树每个中间节点的随机选择的叶子树中,有助于防止噪声消除的可能性,并满足微分隐私。

  • 区块链挖掘和FLchain本地训练都应考虑攻击模型。例如,贪婪的矿工可能通过增强采矿能力来利用FLchain系统,从而控制矿工组修改数据块,或者Sybil攻击的双重支出问题会使采矿效率低下[62]。此外,为了增强FLchain中的隐私,一些技术(如同态加密)对于FL训练中的隐私保护外包存储和计算非常有用,其中数据可以在FL模型聚合的区块链上共享之前进行加密。这在医疗保健等具有高度敏感性的健康数据和个人信息以及非常需要隐私保护的应用程序中非常重要。

八、FLchain在边缘计算中的应用

8.1 用于边缘数据共享的FLchain

在本节中,我们重点分析区块链FL在一些流行应用领域的应用,如边缘数据共享、边缘内容缓存和边缘众感知。

1、用于边缘数据共享的FLchain

物联网数据共享是边缘网络中的关键服务之一,旨在通过共享环境传输数据,以基于边缘计算的方式服务最终用户。在第五代(5G)及以上网络中,提供可靠且可扩展的物联网数据共享解决方案以满足用户日益增长的数据使用需求非常重要。FLchain具有分布式学习和安全性特点,可促进边缘数据共享。

例如,在[67]中提出了一种FLchain方案,用于在分布式多方(如具有BS的工业物联网网络中的移动设备)之间共享隐私保护的物联网数据。给定数据共享请求,将执行多方数据检索过程,以根据注册记录寻找相关方(或数据所有者)作为委员会。这些委员会节点充当矿工,训练全局模型输出训练结果,然后返回给请求者。它们还执行由给定时间段内收集的数据共享事务组成的数据块挖掘。因此,数据所有者和数据请求者可以实现可靠、快速的数据共享,而共享记录则存储在区块链上进行跟踪。

[30]中针对车辆互联网(IoV)提出了另一个基于FLchain的边缘计算车辆数据共享框架,如图5所示,包括三个关键阶段:节点选择、局部训练和全局模型更新。提出了一个节点选择问题,选择参与训练的车辆,然后生成模型更新以构建全局模型。更具体地说,每辆车充当FL客户端,与宏基站(MBS)的聚合服务器协作共享数据。具有不同服务需求(例如交通流估计或路径选择)的车辆可以向MBS提交数据共享请求。通过使用连接车辆的累积车辆数据集运行共享全局模型,MBS将数据共享过程转换为计算任务,以便使用共享成本最小化的DRL算法处理来自车辆的共享请求。特别是,为了提供车辆数据共享的安全性和可靠性,在边缘车辆网络的顶部部署了一个不变的区块链账本,以实现模型参数更新的验证,并以分散的方式将其存储在块中。

FL还与分层区块链结合,以在基于边缘的车辆系统中构建知识共享[68]。训练的参数信息可通过IoV网络共享,IoV网络由RSU和BSs组成,可根据其区域特征在轻量级知识证明(PoK)共识机制上运行的本地区块链管理下划分为单独的组。为了实现智能分布式学习,在特定区域的车辆和RSU之间执行FL过程,然后将训练好的模型与RUSs BSs网络上的全局FL网络共享。

为了在物联网用户之间实现安全的物联网数据协作,在[69]中还研究了私有数据中心、公共数据中心和区块链网络之间的FLchain框架。在此,数据中心旨在收集基于FL的物联网环境中的数据,FL可以利用物联网设备的计算资源来构建大模型。然后,带有参数的模型存储在公共数据中心的分布式数据存储系统中,并具有加密保护。采用基于智能合约设计的区块链,提供灵活、安全的数据管理,支持对用户之间数据使用的访问控制。对人体运动数据集的仿真证实了可穿戴传感器网络在训练精度和安全性方面的高性能。

2、用于边缘内容缓存的FLchain

由于大规模移动边缘网络的高数据分布,FLchain可以提供分布式AI解决方案[70],以支持边缘网络的智能和安全内容缓存。事实上,从物联网设备下载的数据可以由MEC服务器缓存,FL在MEC服务器中发挥着创建智能缓存策略的作用,以应对现代物联网网络中移动数据的爆炸性增长。FL可以帮助克服传统集中式学习方法在高度隐私方面面临的挑战,因为移动用户可能不完全信任第三方服务器,因此不愿将其私有数据共享给MEC服务器。同时,区块链将有助于在用户和MEC服务器之间建立信任,以实现可靠的内容缓存,而无需额外的网络管理基础设施。

[71]中FL可以与区块链集成,为MEC网络中的边缘内容缓存提供安全的学习方案。在这种情况下,物联网设备可以使用自己的数据集协同训练神经网络,然后将计算模型迁移到MEC服务器进行全局聚合。最终目标是估计流行文件,以提高网络边缘的总体缓存命中率。为了解决FL训练带来的通信延迟问题,采用梯度压缩方法减小卸载参数的大小。然后,集成基于区块链的智能合约,在FL通信轮次期间在MEC服务器和物联网用户之间建立可信的训练验证协议。在MovieLens数据集上实验表明,与传统的基于FL的缓存算法相比,在高缓存命中率方面有了显著的改进。FL还可以通过支持MEC网络中内容替换的分布式DRL训练来实现智能边缘数据缓存。移动用户可以在本地学习和训练共享模型,而无需将原始数据共享到网络,而基站的云服务器从分布式用户收集更新,通过平均本地更新来运行公共模型。基于用户和云的合作,内容被描述为一个马尔可夫决策过程,然后由DRL算法求解,以在保持学习精度的情况下优化缓存命中率。

[73]中采用FL来训练DRL代理,为MEC服务器上的智能内容缓存提供指导,从而优化MEC系统中的通信和计算成本。在所考虑的场景中,最终用户依靠FL流程直接实施数据DRL训练,而无需将原始数据和个人信息上传到MEC服务器以保证隐私。然后,多个MEC服务器协调构建一个全局DRL模型,旨在最大限度地降低系统成本,并在边缘网络上实现频谱资源节约。

3、用于边缘众感的FLC链

移动众感知系统旨在利用无处不在的移动设备从物理环境中感知和收集数据,以执行数据分析任务。传统的集中式AI/ML架构通常用于实现智能移动众感知[74],但它们需要直接访问感知数据,这会引起隐私问题。此外,利用单个服务器处理所有感测数据的效率不高,尤其是当数据通常分布在大规模网络中时。FLchain不仅支持高度可扩展的智能边缘数据众感知解决方案,还基于FL和区块链集成提供高度隐私和安全性。

例如,在[65]中研究了FLchain方案,以构建基于无人机(UAV)的移动众感知系统,如图6所示。区块链通过一个不变的账本将无人机与数据任务发布者互连,从而构建一个分散的学习网络,确保无人机之间的数据训练和模型交换得到监控和跟踪,以进行攻击检测和数据修改预防。

虽然FL可以保护AI训练中用户的隐私,但模型更新中嵌入的数据特征可能会泄露,从而泄露私人用户信息。为了克服这一挑战,采用了一种差分隐私技术,在每一轮通信中向局部梯度训练中注入人工噪声。然后,整合激励机制,吸引更多无人机参与AI训练,以提高整体FL性能。基于MNIST数据集(包括60000个训练样本和10000个测试样本,使用卷积神经网络作为学习模型)的仿真验证了该方法的有效性。评估结果证实了无人机的高实用性和低聚合错误,同时减少了收敛延迟。

在[76]中基于边缘计算中物联网的FL设计了一个基于激励的众感知/众包架构。在成功地将其计算参数上传到MEC服务器后,每个客户端都可以获得奖励,以吸引更多用户为运行AI模型贡献计算资源。该激励过程由两阶段Stackelberg博弈建模,该博弈显示了在不同系统设置下效用增益提高22%,优于启发式方法。

[77]基于物联网环境中的集成FL区块链架构研究了另一种边缘众包方案。构建了一个分层众包授权FL系统,用于在网络边缘实现分布式ML训练。最终目标是优化设备制造商的服务质量,同时使用不同的隐私技术保护隐私。为了安全保证,区块链与FL训练相结合,以检测和防止恶意攻击修改梯度更新,并审计FL客户端(如物联网设备)的参数更新。实现结果表明,该算法具有训练精度高、安全性好、系统延迟低等优点。

九、挑战和未来方向

本节主要讨论FLchain中的一些独特挑战,包括安全问题、通信和学习融合问题、经济问题、剽窃问题以及边缘计算系统的延迟要求。还总结了一些可能的研究方向。

9.1 FLchain的安全问题

尽管区块链可以为边缘计算中的FL训练提供分散化和可追溯性,但最近的研究发现区块链仍然存在自身的安全问题。

例如,在区块链平台[78]中,“51%攻击”是一个严重的安全问题,在区块链平台中,一组强大的矿工可以利用网络50%以上的采矿能力控制采矿。这些矿工可以修改区块数据,甚至阻止区块附加到区块链,从而中断用户(如FL客户端)和FL所有者(如MEC服务器)之间的通信。

另一个安全问题是分叉攻击[79],其中产生不同的区块链,导致区块更新规则发生变化,从而使区块链中的同步区块验证无效。这种分叉攻击可能误导FL训练过程中的区块链节点。具体来说,某些节点可以在迭代中使用不同的全局参数来训练全局FL模型,从而导致错误的FL模型聚合。

在FL系统集成区块链之前,需要解决其他攻击,如对智能合约的双重支出攻击和重入攻击[80]。来自对手的伪参数更新也是一个安全瓶颈[81],它可以模拟某个客户端并广播伪参数。这样的对手可能故意广播矿工在挖掘过程中无法识别的虚假样本,从而导致模型聚合不正确。

为了克服这些挑战,在[82]中提出了一种解决方案,使用挖掘池策略来提高挖掘过程的效率,解决安全瓶颈,例如51%的漏洞,减少区块和事务传播延迟。然而,挖掘池集中可能导致自私行为,从而对系统吞吐量构成威胁。另一个有希望的解决方案是开发防御机制,以对抗区块链网络内共识过程的数据威胁。此外,为了降低区块链中的分叉概率,在[79]中采用了大偏差理论来分析有意分叉导致的区块链网络脆弱性,并提出防止分叉攻击的战略规划机制。在未来,有必要将计算能力和攻击检测延迟等资源使用因素纳入分叉分析。此外,智能合约还可以集成到miner网络中,对来自分布式节点的模型更新执行可靠的身份验证。通过使用自执行契约,验证所有模型更新信息以评估消息的正确性,并验证用户标识以检测可能的虚假更新。

9.2 FLchain中的通信和异质性问题

另一个挑战是通信和区块链的延迟与错误对FL训练绩效的影响。事实上,由于不平衡和NonIID数据,上行链路和下行链路中FL训练中的通信都是高度敏感的,因为每个客户端的本地训练数据由于不同的感知环境而在大小和分布上是不同的。此外,当客户机的数量呈指数增长时,由于网络中的流量拥塞增加,大量客户机与服务器之间用于参数更新的直接通信在网络频道中成为瓶颈。这可能会导致通信过程中的高延迟和更高的数据丢失概率,从而导致FL训练收敛速度缓慢且不准确。在FL训练中缓解网络流量的一个可能解决方案是使用压缩方法[83],以减少通信轮中每个客户端的模型更新大小。然而,这种压缩方法通常会增加训练目标的误差下限,因为它们会增加模型更新的方差。因此,有必要选择适当数量的量化级别以达到最佳的错误通信权衡。从区块链方面来看,共识期间区块挖掘造成的延迟和更新偏差也可能会降低FL训练的性能。

由于不同物联网设备的异构训练能力,FLchain系统中FL算法的收敛性并不总是得到保证。事实上,不同物联网设备的特性是不同的,从硬件(CPU、内存)、网络协议(如4G/5G和WiFi)到电池,所有这些都导致物联网设备计算和通信的异构性,并直接影响单设备AI模型的训练时间和学习质量[85]。例如,计算能力有限且连接不良的设备可能需要更长的时间才能完成对服务器的本地训练和模型更新,这可能导致全局聚合的严重延迟。因此,直接应用现有的FL协议而不考虑此类异构设备属性会使整个训练过程效率低下。

已经提出了几种解决FLchain性能相关的方案。[31]中的研究提出了一种新的高效通信协议,该协议能够压缩上行链路和下行链路通信,同时对增加的客户端数量和数据分布保持高度鲁棒性。这些特性可以通过组合使用稀疏化、三元化、错误积累和优化Golomb编码技术来实现,用于上行链路压缩,并在不影响学习收敛的情况下加速全局服务器中的并行训练。此外,在[86]中,针对基于FL的物联网网络提出了一种新的优化算法,称为FetchSGD,该算法可以训练通信效率的高质量模型。在每一轮通信中,客户机根据其本地数据计算梯度,然后使用称为计数草图的数据结构压缩梯度,然后将其发送到中央服务器。服务器维护模型误差,并从误差中提取每轮应用的权重更新。通过这种方式,减少了每轮所需的通信量,同时仍然符合联邦设置的训练质量要求。

此外,设计轻量级共识机制来缓解块挖掘延迟是为了提高整体FLchain训练速度,这可以通过实施轻量级块验证方案来实现[39]。最重要的数据(如本地客户端更新)可以优先添加到块中,以便在FLchain更新聚合中获得客户端之间的一致意见,而签名分配和区块验证可以根据每个客户端的信誉进行简化。例如,由于频繁更新训练贡献而享有较高声誉的客户可以在验证阶段获得更高的优先级,以进行快速区块批准,这有助于减少模型聚合中的延迟和偏差,进而提高整体训练绩效。此外,为了解决FL训练中的异构问题,[87]中的工作在异构环境中提出了一个FL框架,其中设备客户端可能由于其行为而表现异常,并且不同设备上的数据点具有不同的分布。设计了一个模块化算法,包括计算经验风险最小化、计算孤立点聚类算法和在每个簇上实现分布式优化三个步骤,旨在解决每个网络组中不同设备的异构行为所带来的高维问题。

9.3 FLchain中的激励问题

在实际的FLchain系统中,当移动用户既是训练节点又是矿工时,如何鼓励用户加入FLchain过程是一个关键挑战。如果用户没有多少经济效益来补偿计算和存储资源的消耗,则用户可能不愿意将其资源用于执行挖掘。在没有任何服务器(如MEC服务器)来协调FLchain流程和管理区块链挖掘的无服务器场景中,此问题尤为重要。此外,设备的不同特性(如CPU和内存)导致的FLchain节点之间的异质性也会导致节点之间的不平衡。因此,具有较好计算能力的客户可以主导训练和挖掘,以获得更多的回报。因此,如何在FLchain的节点之间实现经济公平是一个具有挑战性的问题。

已经提出了一些解决FLchain中经济问题的解决方案。例如,为了鼓励更多用户实施FL训练和区块链挖掘,非常需要开发平衡良好的激励机制来提高经济效益。[91]中的作者为区块链中的PoW计算实施了一种新的基于声誉的解决方案,在区块链中,移动采矿者受到激励进行诚实采矿。使用博弈论设计了一种基于声誉的算法,鼓励用户加入挖掘过程,以获得额外的利润,并具有资源管理意识。[92]中的另一项工作提出了一种基于信用的激励方法,该方法基于采矿过程中奖惩声誉的收入支付函数。合作开采行为将得到奖励,而具有潜在的非合作行为将从协商一致过程中受到惩罚。该解决方案有望解决当前FLchain网络中的激励问题,旨在吸引更多用户加入挖掘过程,从而增强FLchain系统的鲁棒性。然而,平衡良好的激励机制会影响客户端计算资源的优化。例如,客户机可能为FL分配64%的CPU,为挖掘分配36%的CPU,以实现利润最大化。这种最优分配因激励机制的不同而不同,从而导致AI模型质量和学习延迟的不同结果。

9.4 FLchain中的剽窃问题

FLchain中的另一个独特挑战是块验证过程中的剽窃问题,在这种情况下,懒惰节点可能在没有实际训练的情况下剽窃其他客户机的ML模型。因此,懒惰节点可以为挖掘分配更多的计算资源以获得更多的回报。这一问题不仅造成学习客户之间的不公平,而且显著降低了训练的整体绩效。如果没有有效的解决方案,更多的客户将拒绝参与训练过程,这将降低FLchain系统的性能。

在FLchain中解决剽窃问题的方向包括使用加密技术和激励机制。例如,[94]中提出了一种轻量级认证加密方案,提供可靠的数据加密,同时为硬件受限的物联网设备节省通信带宽和内存资源。[92]中的另一个解决方案使用激励机制,对懒惰节点应用惩罚策略,从其他客户机复制训练参数,而不执行本地学习,同时对诚实节点的训练工作给予奖励。该解决方案有可能防止FLchain中的剽窃问题,并鼓励更多客户加入FL流程,以提高训练绩效。

9.5 MEC系统的低延迟要求

在MEC系统中实施FLchain必须满足客户服务的低延迟要求,如基于边缘的自动驾驶或实时医疗分析。FL可以通过优化训练减少通信延迟,而无需卸载原始数据,但它仍然会因重复通信循环而引入另一个延迟问题,这限制了FL流程的收敛速度。此外,区块链的使用还带来了区块挖掘带来的额外延迟,这给FL系统带来了新的挑战,因为FL客户端需要等待挖掘过程完成,然后才能接收模型更新并执行下一轮训练。

因此,在边缘计算的FLchain实现中,需要采取一些方向来最小化延迟。例如,在[95]中提出了一种FL架构,通过以一种方式执行资源分配来加速FL训练的收敛速度,应将更多资源分配给信道条件更差或计算能力较弱的设备。通过这种方式,设备可以实现AI训练能力的平衡,从而提高低延迟FL训练的模型聚合率。此外,轻量级挖掘设计应重点关注,通过降低事务制定和区块验证阶段的复杂性,同时保持安全性和可伸缩性。此外,为了优化FLchain训练中模型数据卸载引起的无线通信延迟,DRL等AI技术对于构建延迟控制策略非常有用。例如,[97]中提供的基于DRL的方法可以帮助客户端设备了解关于更新大小、传输功率和区块链交易状态的最佳上传规则,目的是在确保用户隐私的同时最小化通信延迟。[98]中还提出了另一种基于DRL的方法,用于调度子信道分配和传输功率控制,以提高无线数据传输速率。在这种情况下,在多代理设置中,移动设备协作以基于本地观察信息优化传输延迟,所有设备的可靠性和低延迟性都被考虑在内。

猜你喜欢

转载自blog.csdn.net/E_chos/article/details/122040625