创材深造:AI + 金属材料:更适合产业落地的方向

编辑/凯霞

3 月 23 日,在机器之心 AI 科技年会上,创材深造创始人兼 CEO 王轩泽在「AI x Science 论坛」分享了主题为《AI + 金属材料:更适合产业落地的方向》的相关内容。

分享就 AI 产业落地过程中可能遇到的问题进行了讨论,包括精度陷阱;行业壁垒并非技术,传统大厂转型自研;某些 toB 领域存在的一些问题;黑盒性质严重,客户不认可,短期内取代不了关键岗位人员;算法效果惊艳但落地艰难等精彩观点。

王轩泽介绍说,AI 赋能金属材料的产业化,可以有效地规避或解决上述 AI 落地中的难点问题。从另一方面讲,高端金属材料是一个经常被忽视的市场,随着产业升级和战略转型,国产化替代的需求被迅速放大。高端金属领域最主要的难点在于过长的研发周期和过大的研发投入,因此使用 AI 赋能新材料的研发成为了弯道超车的最优解。

演讲视频回顾(点击「阅读原文」也可观看):

https://www.bilibili.com/video/BV1SL4y177nR?t=7.0

以下为王轩泽在机器之心 AI 科技年会上的演讲内容,ScienceAI 进行了不改变原意的编辑、整理:

大家下午好!非常感谢机器之心的邀请,非常高兴能够入选机器之心 2021 年度《最具潜力 ScienceAI 创业公司 TOP 10》企业名单。首先,简单自我介绍一下,我通过计算机物理竞赛保送到上海交大,在交大读了本硕,主修人工智能方向。毕业之后去了科创板 AI 第一股的虹软科技,主要做的是图像领域的人工智能算法,帮助国内外头部的厂商做摄像头内置的图像算法落地。离职之后自己创办了敏视科技,主要做工业检测项目,取得了一些小成绩。后来参与了一个 AI+小分子药物的创业项目,具体算法框架都是由我来开发的。现在致力于 AI+基础材料的研发。我是一个创业者,同时也是一个比较资深的算法工程师,所以,很多年在一线从事这些 AI 落地的项目过程中,也是看到了一些 AI 落地的问题。今天这个分享也是希望跟大家分享一下我遇到的或者看到的问题,以及我们为什么最终选择了 AI+金属材料的领域做深入的研究。

AI 落地过程中可能遇到的问题

不知道大家是否在 AI 落地过程中遇到过下面的问题。

第一,精度陷阱。因为算法发展得非常快,所以有一些领域里面,算法公司投入和算法效果的提升,其实并不是一个一次函数的关系,有点类似于 sigmod 函数的情况。在算法发展到一定程度之后,想要提升它的性能需要投入非常巨大的时间、人力,包括精力的成本在其中。这些算法突破上限的难度在不断地提高,同时由于算法的开源程度不断加大,导致算法的门槛在降低,导致一些独立算法工作者也可以利用开源网络做一些项目。一些小型的算法公司针对特意化的需求点做一些调参、模型优化等工作之后,可以进一步地提升算法的效果。但是再想提升效果或者追求效果极致化的话,就需要投入大量的成本,投入的成本是呈几何性质的增加。而且投入非常大的成本之后,效果也只是从 95% 提高到 97%,很多终端用户并不能明显感受到算法提升,导致很好的算法公司,它的算法产品不会比同行或者行业里面平均水平卖得更贵。最终导致这些顶尖的算法公司算毛利的时候还蛮好的,一旦算到净利数据就很糟糕,多年无法盈利。

第二,算法带来的技术壁垒在不断地压缩。因为它的下限在提高,上限突破比较难,虽然区间越来越窄。在一些领域内,反而传统的壁垒仍然是这个领域内的一些壁垒,比如供应链、渠道、品牌、成本等等,这些壁垒反而仍然是这个领域内最核心的壁垒。同时,领域内的一些大厂具备这些壁垒的基础上,自己也在做转型,应用新技术和 AI 技术赋能自己,做他们的产业化升级,这样就会对人工智能的创业公司就会比较难。我之前做图像算法的过程中也遇到过这种问题。现在的图像比较好的手机厂商都有一些自研的团队,很早之前我们都会觉得这些团队不堪一击,但是越来越发现他们的成长速度越来越快,而且竞争力也越来越大,这可能也是行业里面的问题。

第三,对于某些 to B 领域。感觉上任何商业模式都有一些问题,比如平台型公司,它比较大的问题在于它想做到每一个市场细分情景的点上时,很难做到极致化。一些平台型公司用通用型的检测网络,能覆盖到的场景点十分有限,即使覆盖到了这个场景点,如果在专门的场景里面建立一个特意化的网络,对它进行调参和细节调整的话,性能是远远地高于通用性的平台、通用性的网络性能。这可能是平台型公司某些领域内的一些问题。

服务型公司比较大的问题在于,它的成长模型没有平台型公司或者产品型公司那么好,可能类似于线性成长的情况。尽管接的订单里面的核心算法是比较类似的,但是在绝大部分领域内,每个订单的差异性还是很大的。服务型公司想去扩展更大的规模,扩大销售额,或者再有更大的市场占有率,它不得不接很多订单,又会投入很多成本。一旦后续订单接不到的话,可能会对公司整个发展有一定运营上的压力。同时这些服务型公司,尤其在国内工业领域的一些客户,它很难把自己最核心的技术、核心数据和需求提供给这些服务型公司,毕竟是核心机密,这就会导致服务型公司永远积累不下来很核心的数据和产品。之前听说过一些创业者有一种想法,先从服务型公司做起,接一些订单,从订单中获取需求,做成一个产品,再去做销售。听起来很美好,实际上会遇到很多困难。

现在很多公司,自己在做产业化落地转型,有点类似自己用技术造出了一把矿铲,然后自己用矿铲去挖矿,这种相比于平台型和服务型公司更好一些,但是也会面临一些挑战。关键点在于每个领域的核心不同点会导致有更多挑战。做产业化转型的过程中,选择一些比较好的领域是更关键的事情。

第四,黑盒性质严重,客户不认可,短期内取代不了关键岗位人员。人工智能尤其是深度学习网络黑盒性质比较严重。很多客户不太接受、不太认可。尤其是安全相关的领域,比如化工安全。化工安全一旦产生安全事故,它是非常严重的,甚至一个安全事故会导致几十亿的化工企业烟消云散。化工安全要落实到人,问责到人,如果用一个黑盒形式的人工智能网络代替掉整个专家系统或人的评判标准,或者一套逻辑评判标准,就会有问题。最终一旦发生问题,问责到人,发现是一个黑盒性质的网络,怎么得到的结论也没人知道,这是完全不可接受的。

所以,大多数领域会怎么做呢?在原有的一套人的系统基础上,再搭建一套冗余的基于神经网络的系统,这样也会带来一些问题。比如,它并不能节省劳动力,并不能减少成本,反而会增加成本,因为要重新搭建系统。同时,在一些其他领域比如智能驾驶、远程医疗等领域,即使我们的安全系数达到了可用的程度,教育客户的成本也是非常昂贵的。比如智能驾驶,它已经宣传很多年了,即使再过几年让这些驾驶员把手松开,从方向盘上解放出来,在驾驶室上睡觉,也很少有人能做到这一点。

第五,算法效果惊艳,但落地艰难。比如联邦学习,它在跨场景构建生态环境中非常困难,比如前段时间比较火的认知智能,很难获取一些高质量的标注数据。数据也是在某些领域内人工智能落地的难点问题。比如工业检测。有些钢板的缺陷,产线不断运行中,一年只能产出几个甚至十几个缺陷,怎么收集它的数据,这很难。我们只能通过半监督的方式,或者传统算法的基于逻辑的识别能力对它进行判断,但是这肯定没有用大数据训练的方式好,性能、效果都会差别很大。还有 DeepFake,你很难想象它有怎样合规的落地场景。

AI+金属材料,更适合人工智能落地的应用场景

如果大家遇到了这些问题的话,不妨将目光转到 AI+金属材料领域。为什么我觉得 AI 金属材料更适合人工智能落地的场景呢?因为它本身有一些特点,最重要的特点是,它的研发周期非常长,但是验证周期很短。传统金属材料的研发动辄几年、十几年、几十年的周期,类似国外的高端金属材料公司都是一战、二战的老企业,可能经过了几十年、上百年的积累才沉淀下来的研发技术。而一旦金属材料性能达标则可以快速进入生产销售阶段,可以为公司带来比较大的盈利。所以金属材料最核心的痛点在于研发,而人工智能在其中能起到的作用是,用人工智能的技术在整个金属研发阶段有颠覆性的新模式,解决掉了长周期研发的难点问题,一旦用 AI+金属材料解决了研发的问题,后续的一些问题,其实相对来说比较简单。

国内也是有很多案例。比如很多公司都是把原有的技术独立出来做了一家企业,这家企业自己做生产销售,从而上市,取得比较好的效果,比如钢研高纳、西部超导和铂力特等。所以这个路径非常可行,同时,我们最终给终端用户提供的并不是一套算法和解决方案,而是最终的产品、零部件,或者一款材料,这样可以有效地解决人工智能黑盒、客户不认可的问题。

近年来,一些新的制备技术、金属先进技术也会让落地化应用更方便。比如 3D 打印技术,可以说,不需要组建几百人的工厂流水线,几十个人负责几十个 3D 打印设备就可以实现几十个亿的产值了,而且也不会有排放、污染的问题,这是比较好的落地化场景。

在数据方面,近年来数据的积累已经可以支撑我们做人工智能的加速研发。主要从 2011 年开始,中美相继提出材料基因工程,当时可能没有这些 AI 技术,但是大家都已认识到数据是非常宝贵的,不管是企业还是研究院所都在不断地积累数据。

在近一两年来,金属高通量制备技术得到快速发展,也进入了成熟阶段,可以让金属获取更容易,更低成本,足够支撑人工智能技术在金属领域内取得一定的突破。

我们在今年上半年会组建一个高通量的实验室,之后会不断地产出高质量的金属数据,自己做研发。

在市场层面,也有非常大的市场需求。金属领域是一个经常被人忽视的市场,一提到金属领域,大家就会觉得这是低端产能,白菜价、利润率很低、控制成本、压缩成本等等,的确对于一些低端金属材料是这样。但是很多高端的金属材料仍然被国外卡脖子卡得非常紧,高端的金属材料市场非常巨大,超过是十万亿级别美金的市场,每年中国也会进口大量的高端金属材料,因为国内制备不了。同时现在的国产化替代的需求也是非常旺盛,政府在一些核心领域内甚至明确要求必须要有国产化替代率,而且是逐年提升的,在政府的政策和国家规划中能够明显感觉到政策在向这方面倾斜。比如 2021 年科技部的 6+1 的重大专项,那个「1」就是材料信息学,也就是人工智能+金属材料,这可能就是需求端。

对于供给端, AI+金属材料最核心的几项技术,都刚好在这段时间内进入了成熟阶段,包括人工智能技术、金属高通量实验制备技术、3D 打印技术等,这些技术刚好都到达了技术高点,在向产业化落地转化的势能顶点的阶段。

人才方面,今年国内第一批材料信息学博士毕业,大概两三年内会有几百个博士硕士释放出来,现在AI+金属材料现在已经是材料领域最火的研究方向了。所以,这是 AI+金属材料最好的时机。

创材深造,AI 赋能金属新材料研发

下面介绍一下人工智能如何赋能新材料研发,创材深造是如何做的。

一般来讲,金属材料研发模式分为四个阶段。第一个阶段是经验学科,试错偶遇法。第二阶段,是在第一阶段的基础上,通过大量实验总结出了一些物理模型和物理规律,指导我们的实验。第三阶段是计算机兴起之后,把这些物理模型放到计算机里面,用计算机迭代仿真模拟计算,进一步提升研发速度。第四阶段,即第四范式,就是现在用的材料信息学,通过大数据的方式,揭示材料更本质的东西。为什么第四阶段能做到前三阶段做不到的一些事情,因为前三阶段都是基于物理模型做的仿真模拟。这个物理模型怎么来的?是通过一些科学家长时间的积累,抽象出一个近似的物理模型,因为金属材料和其他材料不同点在于,金属材料要的是宏观的性能,在制备过程中不可避免地会引入一些扰动。比如进入了两三个氧分子,包括温度场分布不均匀,这是不可避免的,所以这些公式没办法拟合高冗余度实际发生的物理现象,所以误差非常大,大到不可接受的情况。第四阶段通过超高冗余度的神经网络对物理模型和过程进行拟合,误差小得多得多,已经是可实际操作的阶段了。

通过组织图像找到的是成分和工艺的对应关系,当然我们不是只用人工智能算法去做,我们是一个系统工程,我们也会用 DFT 的算法、材料计算的方法,把算得比较准的特征量作为网络输入参数输入网络,提升效果,大致是这样的逻辑。

材料会对人类社会形态发生巨大影响,材料已经发展了几千年,但是我们实际上所探索的领域非常非常有限。

以三元合金举例。我们探索的 90% 以上都是低熵合金,这个元素可能占整个合金里面 80~90% 以上,其他所有元素加起来可能只有 10% 不到。而中熵和高熵合金探索非常有限,2004 年,高熵合金这个概念才被提出,2010 年才有一些科学家去探索这个领域,所以我们有更广泛的未知的领域让我们探索。为什么高熵合金这么久没人探索?原因在于传统的方式想探索这种高熵合金范围波动非常大,花费的代价远远高于低熵合金。如果用传统方法探索高熵合金,估计要很多科学家积累几代人的经验才勉强能提炼出比较有限的物理模型。但是现在用第四范式的人工智能方式去研究,我们只需要积累大量的数据之后,用人工智能的方式去找到成分工艺到性能的对应关系。找到对应关系之后,可能科学家反而能通过 AI 算法得到的结果,提取出更先进的材料学的原理出来,但是以后材料学的发展,很有可能会变成这样一个模式。

link 

猜你喜欢

转载自blog.csdn.net/qq_35054151/article/details/124750048