数据安全与自由时代何时到来?专访联邦学习全球首个工业级开源框架FATE首位一级贡献者

FATE作为联邦学习的全球首个工业级开源框架,自推出以来便受到各方关注。在1.0版本发布后更是吸引了各行各业人员的目光。FATE共建开源的愿景,使得越来越多从业者投入了开源社区的建设与贡献中。

而随着贡献者激励机制的发布,近日,FATE开源社区诞生了第一位一级贡献者,其提出了“针对SecureBoost算法场景中,联邦计算分裂增益时所用的密码改进”功能。从业者中如何评价FATE?在数据安全、隐私保护领域FATE又有怎样的前景?对此,一级贡献者——腾讯云高级研究员刘洋和我们分享了他的观点。
在这里插入图片描述

首个一级贡献诞生 同态运算时间提效70%

博士毕业于澳大利亚国立大学控制理论专业的刘洋,曾以第一作者在IEEE CDC,IFAC Automatica等控制与决策顶会及顶刊上发表文章,研究兴趣包括复杂网络上的分布式优化、隐私保护下的分布式计算。专业与兴趣之外,刘洋的本职工作也注定与FATE有着难以言说的缘分。作为腾讯云高级研究员的刘洋,现负责腾讯神盾沙箱的隐私保护算法部分,而腾讯神盾沙箱打造的隐私安全+分布式学习的理念,本身就与FATE要解决的“数据安全”“数据隐私”“数据合规”三大问题不谋而合。

刘洋在采访中提到自己与FATE的故事——在2019年年初,自己接触到谷歌提出联邦机器学习的文章,后来逐渐也关注到国内首个“联邦学习”技术,在这一过程中,逐渐了解联邦机器学习的概念,并认为其完全契合腾讯神盾沙箱的功能需求,和自己的同事都在密切关注FATE的进步和完善,并围绕相关进展进行交流。

正是在逐渐深入FATE的过程中,刘洋有了相关的想法及落地——针对SecureBoost算法场景中,联邦计算分裂增益时所用的密码的改进。在刘洋看来,之前的FATE版本仅提供了部分同态的Paillier密码,而Paillier的非对称性在SecureBoost中是冗余的,白白耗费了计算资源。为了给同态运算“减负”,刘洋团队提出了利用对称的仿射密码替代Paillier密码,修改后的版本在实际测试中有着不错的数据表现——在Host有100余条特征的场景中,训练时间可缩短70%以上。

除了此次开发的核心内容及出发点,刘洋还透露了一些小技巧:FATE的逻辑回归和XGBoost算法流十分清晰,对研究人员来说很容易掌握,但如果想流畅进行DTable相关操作,还需要具备一些大规模分布式计算框架的开发经验。

行业负重前行 亟需优化方案

神盾沙箱应对的场景一般是金融领域两个数据资产方的合作场景。一个数据方A拥有感兴趣的用户标签(比如贷款违约记录、保险赔偿数目)以及少量用户特征,另一数据方B拥有全量用户和大量广泛特征。数据方A希望借数据方B之力对全量用户做行为预测,指导业务拉新,以及鉴别灰产。

在这种应用场景中,传统的合作方式是将多方数据中心式合并处理,这里存在着严重的隐私泄露问题,是很多公司的顾虑之一。

在刘洋看来,行业的出发点和困难点是在数据安全层面,关键问题仍在于数据privacy和utility的折衷问题。具体点说,数据要想安全的从孤岛分享出去,必须经历某些“蒙面”(mask)操作:密码学有工具,可以将有效数据转换成乱码,privacy保住了,但密钥在谁手中,极大的影响数据的utility;用噪声混淆原始数据也可以,例如差分隐私,噪声越大,越保证privacy,但使用者拿到数据发挥的utility越低。

怎样在privacy和utility中寻求一条折衷之路,是数据安全流通的关键问题之一。未来理想的状态是,任何数据使用者能够在自由流动和聚合的分布式数据之上,进行高效的数据挖掘操作,而丝毫感觉不到隐私保护的羁绊。

在MPC(Multi-party Computation,多方安全计算)领域,其他解决方案包括混淆电路、可信计算等。这些解决方案的优势在于计算任务的一般性,但使用复杂、需要额外的硬件支持,需要数据使用者支付更多的学习成本,并不利于安全数据联盟的形成。

与之相比,联邦学习在具有普适性的联邦框架中,针对每一种或每一类机器学习算法进行订制化的隐私保护改造,使它们的使用无异于经典的中心式机器学习模型,操作简便、更易上手。另外,由于相比其他解决方案,隐私保护改造的自由度极高,所以有能力的研发人员可以将模型改造的精度无损、效率媲美中心式,更有利于构建安全数据联盟。

FATE×神盾沙箱深化合作 数据安全未来可期

FATE和腾讯云神盾沙箱作为两项同为致力于数据安全的技术,此前一直都保持着良好的合作关系:目前神盾沙箱的核心计算模块由FATE担任,神盾沙箱的开发人员在搭建FATE平台过程中双方交流密切。刘洋在采访中表示,团队在使用FATE框架、算法时,碰到改进效果良好的,将贡献到FATE开源项目中。

这种带有“互助互惠,开源共筑”特色的合作形式,在促进了神盾沙箱的产品打磨和FATE项目的完善的同时,也给其他技术项目或团队提供了很好的样板示范——以开放的姿态拥抱新的技术,不仅于自身有利,也将助推整个行业的发展。

在刘洋的设想中,未来两者可以在提升技术影响力和业务落地等方面发展出更深层次的协作,例如合作发表重要论文、提交专利和联手接手内外部实际业务,形成"学术““业界”两开花的良好局面。

随着越来越多贡献者加入建设,FATE势必会迎来更广阔的的前景。对此,刘洋表示,神盾沙箱和FATE的联手将会加速数据安全的扎根与生长,在数据孤岛之上构建起安全数据联盟的未来可期。
在这里插入图片描述

发布了21 篇原创文章 · 获赞 3 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/weixin_45439861/article/details/100731590
今日推荐