区块链和联邦学习在智能驾驶方面的应用

在这个应用中,区块链和联邦学习的关系:区块链可以增强联邦学习的安全性、隐私性和可信度

1. 数据隐私和安全性:区块链使用加密算法和分布式存储,可以确保数据在传输和存储过程中的安全性。参与方可以在不暴露原始数据的情况下,将加密的模型参数或梯度上传到区块链上进行共享和更新。

2. 去中心化的信任机制:区块链的去中心化特性消除了中心化机构的需求,使得参与方可以直接进行交互和合作,无需信任第三方。区块链记录了所有的交易和操作,确保了参与方之间的交互的透明度和可追溯性。

3. 共享模型和权益证明:区块链可以作为一个共享的分布式账本,记录参与方之间的模型更新和交互。通过区块链上的智能合约,可以实现模型权益证明,确保参与方按照约定进行贡献,并获得相应的权益。

4. 去中心化的模型聚合:区块链可以作为一个去中心化的模型聚合平台,将参与方的模型参数或梯度进行聚合,并更新全局模型。由于区块链的安全性和可信度,参与方可以放心地上传和共享自己的模型更新,从而实现更好的全局模型效果。

读论文

1 面向互联自动驾驶汽车的分散联邦学习方法。

A Decentralized Federated Learning Approach For Connected Autonomous Vehicles

本地车载机器学习(oVML)

什么叫区块链的共识机制?

区块链技术的共识机制是指在区块链网络中,参与节点之间如何达成共识并确认交易的有效性和顺序的一种机制。由于区块链是去中心化的,没有中央机构来验证和确认交易,因此需要一种共识机制来确保网络的安全性和一致性。

扫描二维码关注公众号,回复: 17153711 查看本文章

共识机制的目标是让所有参与节点就交易的有效性和顺序达成一致,避免双重支付、篡改和欺诈等问题。以下是一些常见的区块链共识机制:

1. 工作量证明(Proof of Work,PoW):PoW是比特币最早采用的共识机制。参与节点需要通过解决一定难度的数学问题来证明自己在网络中的工作量,并获得记账权。第一个解决问题的节点将获得奖励,并将交易打包到区块中。这个过程需要大量的计算能力和电力消耗。

2. 股权证明(Proof of Stake,PoS):PoS是一种基于持有货币数量的共识机制。参与节点需要锁定一定数量的货币作为抵押,并根据抵押数量来选择记账权。持有更多货币的节点有更高的几率被选为记账节点。PoS相比PoW消耗更少的能源,但也存在寡头垄断的问题。

3. 权益证明(Proof of Authority,PoA):PoA是一种基于授权的共识机制。在PoA中,只有经过授权的特定节点有权进行记账和验证交易。这些节点通常由网络的管理者或信任机构授权。PoA机制适用于私有链和联盟链,可以提供更高的吞吐量和性能。

4. 权益证明(Proof of Elapsed Time,PoET):PoET是一种基于时间的共识机制。每个参与节点在竞争中随机等待一个随机时间段,等待时间最短的节点将获得记账权。PoET使用硬件随机数生成器来确保公平性。

这些共识机制各有优劣,适用于不同的场景和需求。共识机制的选择取决于区块链的性质、网络规模、安全需求和性能要求等因素。

该框架具有可控制的网络和BFL参数,如重传限制、块大小、块到达率和帧大小,从而捕捉它们对系统级性能的影响。

对oVML系统动态的严格分析量化了BFL的端到端延迟,这为通过考虑通信和共识延迟来获得最佳块到达率提供了重要的见解。

下一代无线网络的设想是保证低延迟和超高可靠性,随时随地和移动。the real-time communication constraints for the impending autonomous vehicles.这将满足即将到来的自动驾驶汽车的实时通信约束。车载机器学习(oVML)是一种有说服力的解决方案,其中每辆车都保持其最佳机器学习模型,从而能够做出明智的决策,即使在一段时间内失去连接。训练这样的oVML模型需要比每个车辆收集的样本更多的数据样本。因此,它需要与相邻车辆进行数据交易(和知识交换)。每辆车都拥有本地收集的数据样本,他们的交易和知识共享应该使原始数据对其他邻近车辆保密。每辆车交换其局部训练的模型更新(主要是梯度参数和学习权重),而不是原始数据。需要快速响应现实世界。

这个整个图其实就代表联邦学习最上面他是global update,它是一个全局聚合更新的一个过程,然后local Update,他是一个本地更新的一个过程,首先本地下载初始模型,他需要在本地利用本地的数据更新以后,然后将模型参数上传到服务器,再进行一个全局聚合,全局聚合完成以后,再将模型下发给local本地,然后这个算是一次迭代的一个过程。

联邦学习中的local update指的是在每个参与方设备上进行的本地模型更新。在联邦学习中,多个参与方设备共同训练一个全局模型,而每个设备只能使用本地数据进行训练,不会将数据传输到中心服务器上。为了保证全局模型的准确性和一致性,每个设备需要将本地模型的更新结果反馈给中心服务器,由中心服务器进行全局模型的更新。

在每个参与方设备上,local update的过程通常包括以下几个步骤:

1. 选择一部分本地数据作为训练集;
2. 在本地设备上使用训练集进行模型训练;
3. 计算本地模型的梯度或权重更新;
4. 将本地模型的梯度或权重更新反馈给中心服务器。

在联邦学习中,local update是一个非常重要的环节,因为每个参与方设备的本地数据可能具有不同的分布和特征,对于全局模型的训练和更新具有重要影响。因此,如何设计和优化local update的过程,是联邦学习算法中的一个重要研究方向。

全局模型是所有本地训练模型更新的综合平均值。

GFL的训练完成延迟有时可能在几分钟左右(10分钟或更长时间)。为此,我们提出(并评估)一种基于区块链的联邦学习(BFL)模型,GFL依赖于单个全局服务器,容易受到服务器故障的影响,高度依赖于网络连接,并且由于瓶颈而受到严重影响。删除GFL的集中式全球服务器并使用区块链,并提出一种基于区块链的联邦学习(BFL)方法,其中网络系统能够交换来自车辆的本地模型更新,同时提供并验证其相应的奖励。

现在的理解是,之前GFL是通过本地数据本地更新成本地模型,然后上传到全局服务器更新成全局模型,然后再下发到本地,完成一次迭代。现在BFL是通过本地数据本地更新成本地模型,然后通过区块链技术来经由网络系统完成车辆间的模型更新,验证并通过广播播送。

BFL克服了集中故障问题,并通过本地训练模块的验证过程将其联邦的范围扩展到公共网络中不可信的车辆。为什么?更重要的是,通过提供与数据样本大小成正比的奖励,BFL促进了拥有更大数据样本的车辆。因为有mining raward。矿工可以是移动的车辆,也可以是网络边缘的独立节点(如WiFi接入点或蜂窝基站),这些节点对于挖矿过程来说计算能力相对较强。所有矿工交换并验证他们所有的本地模型更新,然后执行他们的工作量证明。当矿工完成工作量证明时,它通过记录经过验证的本地模型更新来生成一个块。最后,该块(由聚合本地模型更新组成的生成块)被插入到区块链的分布式分类账中。然后,所有相关车辆都可以使用这个新插入的块来计算所需的全局模型更新。

现在的理解是:GFL是有可能出现故障的,而BFL更安全可靠,这对于路上驾驶非常重要。还有就是区块链技术的mining reward使本地数据更多。

使用BFL,可以观察到全局模型更新在每个车辆上都是局部可计算的。此外,我们的BFL设计还保证了矿工,节点或车辆的故障或故障不会对任何其他车辆(整个网络系统)的全局模型更新产生不利影响。然而,有一个权衡:为了掌握上述所有的好处,与GFL相比,由于系统中的区块链管理,BFL会产生额外的延迟。为了量化(并解决)区块链带来的延迟,我们通过计算工作量证明、通信和计算延迟,对具有BFL的系统进行了总端到端延迟分析。根据模型的相关见解,我们通过动态调整块到达率(即区块链系统的工作量证明复杂性)来最小化系统的整体感知延迟。

我们的联邦训练是一个回归问题,重点是通过考虑数据样本的整个状态空间来并行解决问题。

回归问题是什么

回归问题是机器学习三大基本模型中很重要的一环,其功能是建模和分析变量之间的关系。

回归问题多用来预测一个具体的数值,如预测房价、未来的天气情况等等。例如我们根据一个地区的若干年的PM2.5数值变化来估计某一天该地区的PM2.5值大小,预测值与当天实际数值大小越接近,回归分析算法的可信度越高。

GFL中,求解方程(1)的默认思路是使用随机梯度算法在每个oVML上进行局部训练,然后通过分布式牛顿方法进行全局训练以聚合局部更新。使用BFL,我们设计了一个通用的可信赖框架,用于通过分布式分类账共享来自所有车辆oVML的本地模型更新,其中块保存本地更新,并通过使用M矿工执行验证。BFL在每辆车上本地计算全局模型更新,这不仅增加了对中央服务器故障的鲁棒性,而且i)减少了计算延迟,ii)完全消除了全局更新传播延迟(从中央服务器到车辆)。

正如预期的那样,延迟随着信噪比的增加而减小,数值和仿真结果都很好地捕捉到了这一点。

在本文中,我们通过区块链增强了联邦学习,以提高自动驾驶汽车的性能和隐私。我们的BFL框架促进了自动驾驶车辆之间的有效通信,其中本地车载学习模块以完全分散的方式交换和验证其更新。BFL利用区块链的共识机制,成功实现了无需集中协调的车载机器学习。此外,我们对端到端系统延迟的BFL网络系统动态进行了全面的分析,这为获得最佳块到达率提供了重要的见解。

现在的理解是:BFL相对于GFL来说,引入了区块链技术,这使得各个车辆在本地完成本地训练后得到本地模型,然后不再是上传到中央服务器,而是通过区块链技术在各车辆间进行模型更新,并形成块,这极大增强了系统的鲁棒性,也降低了计算延迟,更是完全消除了传播延迟。而且其mining reward能够扩大样本范围。

计算延迟应该和这个有关:该框架具有可控制的网络和BFL参数,如重传限制、块大小、块到达率和帧大小,从而捕捉它们对系统级性能的影响。

2  6g自动驾驶汽车的分散联邦学习框架

A Dispersed Federated Learning Framework for 6G-Enabled Autonomous Driving Cars

安全性、鲁棒性和高效率

CAVs 自动驾驶汽车

联邦学习自身的实现挑战,如鲁棒性,集中式服务器安全性,通信资源约束以及由于恶意聚合服务器推断终端设备敏感信息的能力而导致的隐私泄露。

分散联邦学习(DFL)框架,以提供鲁棒性、通信资源效率和隐私感知学习。

提出了一种混合整数非线性规划(MINLP)优化问题,以最大限度地减少由于分组错误和传输延迟导致的联邦学习模型精度损失。由于公式化MINLP问题的NPhard和非凸性,我们提出了基于块连续上界最小化(BSUM)的解决方案。

3 Bift:基于区块链的无人驾驶汽车联邦学习系统

Bift: A Blockchain-Based Federated Learning System for Connected and Autonomous Vehicles

数据安全方面的联邦学习(FL)是近年来兴起的,它可以提高分布式机器学习的数据保密性,然而恶意攻击者仍然能够攻击训练过程。由于完全依赖中央服务器,所以FL非常脆弱。为了解决上述问题,我们提出了Bift: 1)一个完全分散的ML系统,结合FL和2)区块链,为cav提供一个保护隐私的ML过程。使分布式自动驾驶汽车能够使用自己的驾驶数据在本地训练ML模型,然后上传本地模型以获得更好的全局模型。更重要的是,Bift提供了一种名为“联邦学习证明”的共识算法来抵御可能的对手。具有可扩展性和鲁棒性,并且可以抵御恶意攻击。

FL也带来了一些新的威胁,如下所示。

1)恶意客户端很容易通过投毒攻击来攻击FLs进程,例如不诚实的客户端可以上传不正确的梯度或参数来破坏全局模型[17]-[19]。

2)中央服务器收集和聚合模型参数,容易出现单点故障,导致服务崩溃。一旦单个服务器被破坏,将会造成巨大的事故。

3)中央服务器难以承受来自多个客户端的海量吞吐量,路上的自动驾驶汽车需要相互传输数据,例如每辆自动驾驶汽车每时每刻采集的高精度地图。

4)很难评估特定节点对模型的贡献。在现实世界中,如果没有激励,客户是不愿意提供自己的数据的。

为了满足联邦学习的安全性和隐私性,我们提出了bbit,一个完全分散的机器学习系统,具有区块链、星际文件系统(IPFS)和联邦学习[15],为cav提供一个保护隐私的机器学习过程。bbit提供了基于区块链和独特的联邦学习共识协议证明(PoFL)的抵御恶意攻击的能力。

鼓励自动驾驶汽车通过反馈股权的方式积极训练和上传本地模型;可以减少FL进程的通信和计算开销;可以摆脱对中央服务器的依赖,具有更快的收敛速度和更稳定的网络环境。

共识算法是区块链的核心组成部分。共识机制的目标是让所有参与节点就交易的有效性和顺序达成一致,避免双重支付、篡改和欺诈等问题。工作量证明(Proof of Work,PoW):PoW是比特币最早采用的共识机制。参与节点需要通过解决一定难度的数学问题来证明自己在网络中的工作量,并获得记账权。第一个解决问题的节点将获得奖励,并将交易打包到区块中。这个过程需要大量的计算能力和电力消耗。区块链已被广泛应用于解决FL中的单点故障和安全问题。

FL中主要有两种聚合算法:1)FederatedSGD[35]和2)FederatedAvg[15]。这是什么?

在原始的聚合算法(如fedag和FedSGD)中,中央服务器聚合所有本地更新而不检查它们。这两种朴素算法被广泛应用于非对抗设置。但在现实世界中,特别是在一个极度分散的联邦中,可能会有恶意的客户端试图破坏FL模型,因此朴素算法在cav场景下并不鲁棒。为此,提出了一些拜占庭鲁棒聚合规则来抵御FL中的恶意客户端。

bbit基于区块链实现了高效、安全的点对点FL。对于这个过程,bbit的设计有以下目标。

1)生成一个最优的全局模型,即使在有限的恶意环境中(高达30%的恶意节点),其性能也与没有对手的原始FL大致相同。

2)我们的Proof of FL共识算法可以防止中毒,该算法与多个Byzantinerobust聚合规则相结合。

3)不需要中央服务器,它可能随时崩溃,并由单个公司控制。在我们的制度中,每个人都是平等的。

4)我们系统中的cav具有通过点对点文件交换系统高效利用网络带宽和低延迟共享数据的能力。

星际文件系统(星际文件系统是分布式存储和共享文件的网络传输协议,内容可寻址,节点构成分布式文件系统。InterPlanetary File System  IPFS

区块链中的每个块包含上一次FL迭代的记录。每个CAV都可以从区块链获取最新模型的信息,如model的model_id、ipfs_hash、所需的total_iteration、current_iteration、当前全局模型的精度等。CAV可以在最后一个训练任务完成后上传一个训练任务,bbit会将包含FL训练任务信息的块广播给其他CAV。一旦CAV接收到广播,它将开始使用自己的数据和计算能力训练本地ML模型。当足够多的cav通过IPFS上传了自己的局部模型时,bbit将通过PoFL算法对它们进行聚合,并将聚合的全局模型发送回cav,然后cav开始该任务的下一次迭代,直到模型收敛。

现在的理解是:

在本文中,我们提出了一个基于区块链的cav FL系统,命名为bbit,并给出了系统的细节和工作机制。提出了一种防御恶意节点的共识算法PoFL。与现有的工作相比,PoFL具有更好的防御恶意攻击的能力。此外,我们还通过IPFS提供了一个高效稳定的数据共享系统。实验表明,该数据共享系统的性能优于传统的SFTP。我们的工作可以提高cav分布式机器学习的性能。在拟议的框架中考虑能源效率问题的未来工作正在进行中。

猜你喜欢

转载自blog.csdn.net/m0_48022770/article/details/133983281
今日推荐