当区块链遇上人工智能,会发生什么?

DeepBrain核心团队是国内第一批AI创业者,曾研发出国内最早的中文语音助手—智能360(2011年)、远场语音交互设备—小智超级音箱(2014年)以及AI云平台。


算力、数据:困扰AI的两大痛点


长期处在AI行业的开发经验,让他们逐渐发现了AI本身固有的痛点:数据和算力,也萌生了用新技术解决问题的想法。


数据方面的问题首先是使用权和拥有权难以分离。AI中任何模型的建立,都离不开海量的数据。数据从哪里来?往往需要从别的公司买,假如一家卖数据的公司,好不容易采集到了很多数据,卖给别人后别人再转卖出去,那么数据就不值钱了。数据的问题在于很难实现数据使用权和拥有权的分离。实际上卖数据的企业是想把使用权卖出去,但不卖拥有权,问题是数据多次复制,他们的拥有权受到了损害。


其次是数据隐私隐私问题。一家卖数据的公司,采集了几百万的数据,但并不代表几百万用户授权给他去卖,往往都是从各种渠道抓取来的,这里面就含有多多少少的用户隐私,法律风险很高。例如Alpha Go的公司Deep Mind,想要开发医疗版的Alpha Go,他们从英国一个组织NHS拿了160万的患者数据,被英国法院判为非法。所以AI行业的一个普遍困扰是:用户不一定同意数据被出售,而AI必须基于海量数据,全部同意很难做,如果没有数据又做不成。虽然大部分数据会做脱敏处理,但是数据传输过程中的数据泄露有时还是无法避免,例如处理数据的公司里有很多技术人员、数据编辑,你怎么知道一些敏感信息会不会泄露呢?核心原因在于中心化的处理方式。


数据隐私、拥有权和使用权无法分离,共同导致了很多有价值的数据只能自己用,比如驴妈妈有很多用户旅游信息数据,但是只能用自己的AI引擎进行分析,来对自己的品牌优化。在马云所说的“DT时代”,数据就是金矿,对于一些与其没有竞争关系的公司,完全可以利用这些数据去发挥更大的价值。


第二是算力成本问题。DeepBrain CEO何永介绍,为什么现在的AI企业大多数都估值很高,因为其中的硬件投入非常大。传统互联网企业用户的点击、查看、转发单个用户计算消耗资源小,而AI的计算要求高几百几千倍,因此对高性能计算定制深度学习芯片要求很高,意味着很多企业要花很多钱买算力、建很多计算中心,造成了很大的资源浪费。


DeepBrain CEO  何永






深脑链:将算力与数据分离


何永开始接触区块链也是从比特币开始,他对新技术一直非常的好奇,于是自己开始研究比特币底层技术,觉得这是未来的一个趋势,加上本身他在做AI行业,就产生了能不能结合解决行业痛点的想法,而区块链刚好合适。


在DeepBrain的基础上,基于区块链技术开发DeepBrain Chain深脑链。何永介绍,Deep Brain Chain深脑链是他们正在开发的一个区块链方向,DeepBrain和DeepBrain Chain的关系可以理解为淘宝和支付宝的关系,DeepBrain是人工智能操作系统,消费者可以和设备进行对话,给消费者提供各种各样服务和能力,目前DeepBrain是中心化的,但如果跑到DeepBrain Chain上就变成了去中心化操作系统,深脑链本身是去中心化的人工智能计算平台,平台上面可以跑很多AI应用,DeepBrain是早期的大应用,就像是支付宝早期给淘宝用的,现在可以接入其他商户一样的道理。


深脑链体系的设计思路是这样的:每个厂商节点是AI计算节点,企业提交需求,如图像识别、语音识别等到链上,由每个挖矿节点帮你计算,深脑链提供AI算力支持和优化,算力由节点提供,上层提供节点优化,保证机制运转,让整个AI以更低的成本去获得更多算力,服务更多用户。这样能够显著降低成本,将算力投入控制在原来的10-30%左右,通过算力分离解决了算力资源耗费问题。

其次是隐私问题,何永介绍,本身算力和数据隐私看起来完全不相关,但是正是因为算力分离的设计,两者就紧密关联在了一起。



为什么AI会涉及到数据隐私问题,主要还是因为每个人的机器是自己的,当然可以随便折腾,数据随便拿。在深脑链体系里不是,AI企业想要买数据可以在交易所里买,卖方首先对数据进行加密,买方买到后拿到密钥,但是并不拿到数据本身,之后数据进入某个计算节点,3者都互相不知道身份。数据进入计算节点后,买方把训练算法给他,计算形成模型,在发送给另一个计算引擎节点,模型输出过程将在设备里解谜,如果做了一些隐私处理计算引擎也拿不到模型。最后把把算法放到计算引擎里,直接输出给客户,完成整个过程。


整个过程分离了算力和数据,使得数据使用方无法获得数据拥有权。不像是传统的数据处理过程,数据放到自己的机器里,我知道机器在哪,我对机器有控制权,可以随时取用数据。深脑链体系中任何一方不知道数据在哪,没有控制权,也取不出来。因为买家买数据的目的不是把数据拿过来,而是训练成模型,仅此而已,这样对于AI企业已经足够了。总结起来,就是:“我有训练算法,你有数据,它有算力,在匿名情况下互相合作,形成最终的应用程序。”



他们基于Onchain的技术开发DBC,本身专注于做挖矿、如何分配计算资源、数据资源保护、密码学、云计算、AI方面的研发。


而目前做AI+区块链的公司还有几家,那么彼此之间有没有竞争关系呢?何永认为,如果深入研究,他们在全球范围没有任何竞品。例如,有的是用AI解决区块链的问题,它们的理念是做第三代智能合约,第二代智能合约如以太坊虽然是图灵完备,可以做复杂循环计算,但是不能跑AI算法,他们希望让AI算法也跑上去,与深脑链完全没有关系。


还有的做的是数据训练众包,解决的是数据产生的问题。例如图像识别需要100万张人脸数据,如何产生呢?这就要进行大量的人工数据标注,如判断某张脸是不是人脸,是就输入“是”,不是就输入“不是”,这项工作非常繁复、技术含量不高,但是又很重要。他们在链上做激励机制,如果数据好的话给你代币奖励,让一拨人标记数据就可以形成一波质量比较好的用户数据。他们解决的是数据产生问题,深脑链解决的是数据隐私问题,两者也没有交集。


何永认为,从“赛恩斯理论”来看。他们的一个很大的优势是“可防御性”。防御指的是企业有没有抵御新公司的竞争的防御性,其中不仅仅是技术壁垒,更重要的是用户壁垒。例如,像安卓操作系统,所有手机厂商不可能用安卓以外的系统,因为消费者已经形成了使用习惯,加上开发者的应用数量,已经形成了高门槛的商业生态。Deep Brain也是一样,智能设备背后有很多技能,全部是来自于DeepBrain,和消费者是直接接触的,很难以改变习惯。


目前深脑链公链计划明年三季度初正式上线, DeepBrain将切换到DeepBrainChain之上。


融资方面不久前义语科技获得了GSR、戈壁、钱世等3200万的融资,未来将有进一步融资计划;此外,他们也在大力招募人才,希望有更多底层优化、AI、区块链、云计算、密码学安全领域的技术人才加入他们团队。


招聘需求:

岗位名称:前端研发工程师、社区运营

坐标:上海


猜你喜欢

转载自blog.csdn.net/ravenblockchain/article/details/78668992