他们带着大模型,到行业原野中去

8d2dae54cc832d0b7c3b4f66f0e22fe5.jpeg

每隔一段时间,都会重读一遍梁启超先生的《少年中国说》。

在向科技要答案的时代,在技术创新愈发可贵的时代,这篇我们都学过的文章中蕴含着极大的价值。比如,其中说“使举国之少年而果为少年也,则吾中国为未来之国,其进步未可量也”。每一项技术都是初生的少年,但这些技术创新真的有少年心气吗?

我们的技术,是否真正心怀宽广,愿意进行根技术的全栈创新?

我们的技术,是否愿意走出家门,步履四方,去了解应用场景,去洞察行业需求?

我们的技术,是否能与大势相结合,承担起自己的时代责任?

在大模型掀起的新一轮全球AI热潮中,这些问题的答案变得尤其重要。几个月以来,中国已经陆续发布了数十款大模型。但总有网友在问这样一个问题:中国做了这么多大模型,究竟有什么不一样?

我们是该坚持“人有我也有”的老成稳重,来亦步亦趋做AI ,还是要积极与这片土地结合,做出“人无我有”的新智能?

680fd9009fcc839a033b99fe2091b3c8.png

如果你的答案也是后者,那么盘古大模型3.0值得了解一下。

在7月7日举办的华为开发者大会2023(HDC.Cloud 2023 )期间,华为云发布了盘古大模型3.0。与其他AI大模型不同的是,华为云选择去到行业原野里,写一篇「少年AI说」。

AI大模型

需要一些少年气

c3ac5a00203695a3d7fd564c3d2c3486.png

梁启超在《少年中国说》里讽刺了一种暮气沉沉的现象,“虽轰雷盘旋其顶上,他事非所顾也,非所知也,非所闻也”。

技术创新中,经常也会陷入类似状况:一项技术火了,大家就一拥而上,只要能够做出差不多能够交差的东西就行。在第三次AI崛起已经超过十年的今天,这种暮气已经显现出来。比如说,AI大模型通用性好,泛化性强已经成为产业共识。但大模型的应用,目前还处在比较传统的轨道上——写写诗,答答题,跑跑分,刷刷纪录。模式上看,这与深度学习十年来的应用逻辑只有量变,缺乏质变。

当大模型遇上如火如荼的数字中国建设,无数企业会问:亭台楼阁中的大模型很好,但我的行业为什么用不到?

中国大模型想要发展,必须要直面并回答这个问题。

29aaa80436aa7e62613ac0ce81fb06e6.png

综合来看,目前产业与大模型结合的门槛依旧很高,集中表现为以下几个方面:

1.AI技术本身门槛高,成本高。从算力成本、数据成本、开发成本、人才成本多方面,企业应用AI并不容易,这为大模型落地造成了基础阻碍。

2.数据安全和基础设施隐忧。大模型是企业的核心数字化资产,需要得到核心技术、数据应用方面的多维度保障。尤其是AI大模型的技术自主化水平,在全球环境中正变得愈发重要。

3.大模型缺乏与行业结合的必要节点。行业应用大模型,不仅需要模型的通用性与泛化性,还需要模型具备专业知识,具备行业技能。

怎么克服这些挑战?答案不在办公室、实验室里,而在广袤的大地上。我们必须要像少年一样走出去,走到行业当中,走到原野当中才能看见问题,找到答案。

今天的中国,数实融合成为了产业经济的大势所趋。中国经济的优势是行业众多、产业体系全面,各行业的数字化、智能化动力蓬勃强劲,以东数西算为代表的国家级数字化基础设施快速发展。

大模型必须与这些优势、需求结合,才能创造革命级的科技生产力,激活千行百业的深层价值。

从2021年发布以来,盘古大模型一直在思考客户运营、产品研发、软件工程、生产供应、市场营销等行业客户真正关注的问题。“不作诗、只做事”的盘古大模型,凭借一股活泼生动的少年气,走向了行业原野。

be0fbe95a2f11a7b59c5eb5933e934a5.png

到行业原野中去

盘古大模型3.0有何不同?

在华为云“AI for Industries”的思路下,结合时下产业界最关注的大模型能力趋势,盘古大模型3.0实现了一系列升级,围绕“行业重塑,技术扎根,开放同飞”三大方向,持续打造核心竞争力。

HDC.Cloud 2023当中,全面展示了盘古CV大模型、盘古预测大模型、盘古科学计算大模型、盘古NLP大模型、盘古多模态大模型五大基础模型,并且发布了系列行业大模型,其中包括政务、金融、制造、轨道行业大模型。

4c446bb8c5e2227dd4b58f426e0ca0fd.png

在技术差异化层面,盘古大模型3.0包含一系列新技术特性。

其中最为外界关注的大语言模型与多模态模型领域,盘古3.0可以提供100亿参数,380亿参数,710亿参数和1000亿参数的系列化基础大模型,匹配不同场景、不同时延、不同复杂度的行业需求。而这些模型可以提供一致的能力集,包括大语言模型的知识问答、文案生成、代码生成、NL2SQL、插件调用等外界十分关注的能力,以及多模态大模型的图像生成,图像理解等能力。

在应用结构层面,盘古大模型3.0构筑了完全面向行业提供服务,以行业需求为基础设计的大模型体系,包括5+N+X三层架构,即5大L0层的基础大模型,能够提供通用技能,支撑企业的各类应用;N个L1层的行业大模型,能够基于基础大模型的多种能力组合,帮助企业通过数据微调打造符合自身需求的大模型产品;X是海量的L2层场景模型,场景模型更加专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务。

在这三层结构的加持下,盘古大模型3.0可以适配企业的各种需求,并通过多样、灵活的组合排列,形成符合千行百业需求的“千面大模型”。

盘古大模型3.0,究竟为何能深入行业,立足行业?这个问题,需要我们记住三个关键词。

红日初升,其道大光

大模型背后的行业沉淀

08d2f59773b2fda7b8669ca100a907ff.png

第一个关键词:行业经验。

所谓“了解行业”,并不是某种标准化能力,而是无数技术体系、产业体系搭建成的经验集成。积累行业经验没有捷径,而是必须一个个场景深入进去,一个个案例钻研下去,去矿山,去码头,去实验室,才能用水磨功夫聚集起行业经验。

依托华为行业军团,华为云沉淀了超过400行业解决方案,并和伙伴联合打造7大行业aPaaS,从而真正沉淀各个行业的核心诉求、核心知识、核心能力。在AI方面,华为云AI已经在各行业有超过1000个项目的合作经验,对各个行业的智能化诉求有具体、细致的了解。而在华为云AI for Industries的大方向下,我们可以看到盘古大模型本身即与行业知识深度结合,学习了10多个行业公开数据,涵盖金融、政务、气象、医疗、健康、互联网、教育、汽车、零售等,在每个行业板块中学习了超过500亿 tokens的数据量。

行业种类众多、涉及合作规模庞大、行业数据量巨大的行业经验,最终造就了盘古大模型在行业原野上的“其道大光”。

以矿山大模型为例,让煤矿工人在办公室中进行远程操作,是煤矿智能化发展发展的重心。但远程操作会面临矿井内大量粉尘、水雾遮挡摄像头,弱化监控效果的问题。面对这个难题,盘古大模型可以将超过100路视频拼接在同一个画面上,通过透尘算法,异物检测等视觉大模型技术,实时识别采掘过程中的大块岩石、大块煤、煤仓卡堵等异常情况,从而实现地面工作人员不下井,就能在看清看准的情况下实时操控采煤机作业。

目前,基于盘古矿山大模型,华为云与山东能源集团深度合作,开发了21个场景化应用,覆盖能源行业7大业务系统盘古大模型的成功应用,让煤矿工人工作环境更加舒适安全,极大提升了矿山行业的生产效率与安全水准。

行业沉淀不是朝夕之功,而是经年累月的融合与突破。盘古大模型能够真正融入行业,是因为它一早就为行业而生,而且在这条路上躬耕良久。

b957fd45c9a605e8e51dd54f87ab8ba3.png

乳虎啸谷,百兽震惶

自主创新的AI时代

第二个关键词:自主创新。

在当前局面下,科技自立自强已经成为国家战略,行业所需,尤其在涉及国计民生的重点行业,在面对大模型机遇时候对其自主创新水平提出了新的需求,也只有走向全栈自主创新,才能够满足这些行业的智能化需求,真正让AI进入行业原野。

为此,华为云盘古大模型在算力、芯片使能、AI框架、AI平台实现全栈自主创新。华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,以及异构计算架构CANN、全场景AI框架昇思MindSpore、AI开发生产线ModelArts等,为大模型开发和运行提供分布式并行加速,算子和编译优化、集群级通信优化等关键能力。基于华为的AI根技术,大模型训练效能可以调优到业界主流GPU的1.1倍。

f7cf35c07251fa511151d1f402956f20.png

(华为常务董事、华为云CEO张平安)

同时,华为云还积极推动大模型事业与东数西算战略进行结合,会上,华为常务董事、华为云CEO张平安宣布单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线。昇腾云服务可以提供更长稳的AI算力服务,千卡训练30天,长稳率达到90%,断点恢复时长不超过10分钟。

随着AI技术的发展,社会经济的智能化跃升尽在眼前,而自主创新是这个时代不可规避的核心使命,打造世界AI另一极,成为了华为云的责任,也成为了中国科技的机遇。

前途似海,来日方长

以可用性为路标的AI云服务

56b8418a8973d84f88a13c2d4652086b.png

第三个关键词:真实可用。

大模型的行业落地,需要面对一系列复杂的环境挑战、人才挑战、商业挑战。克服这些难题,不仅需要技术能力的提升,更需要在各个环节提升大模型的易用性,降低产业智能化门槛。对此,我们不能闭门造车,想当然地发展AI、发展大模型,而是需要走到真实的产业需求、开发者需求当中去。

为此,华为云以可用性为路标,构筑了一系列真实可用的AI云服务。比如我们上面讨论的大模型商业模式,就通过L0、L1到L2的三层模式,全面打通了大模型的商业模式问题,解决了企业用户在大模型专属性、订制化方面的难题。

除此之外,华为云应对企业不同的部署需求,提供了包括公有云、公有云大模型专区、混合云等多种部署模式,从而满足不同类型企业对大模型的部署需求。

在大模型的开发友好度方面,华为云提供了易用可靠的大模型工具套件、汇聚海量多行业场景API的开天aPaaS,以及包含丰富优质课程和技术认证的大模型专属社区,希望与开发者及伙伴一起,共同探索盘古大模型与行业结合的创新路径。

8b8ddcba03261fac442ad0ba8ca505be.png

《少年中国说》中提到,“少年智则国智,少年富则国富,少年强则国强,少年独立则国独立”。AI大模型技术处在国际战略与产业革命的关键赛点上,对于社会经济的数实融合、智能化升级来说,大模型扮演着“AI强则科技强,AI独立则科技独立”的角色。

这时候,我们需要勇于承担责任,敢于探索未知的大模型体系。AI需要到行业知识中去,到自主创新中去,到开发者身边,到企业内部,到一间间工厂中去,到一座座矿山中去。走向原野,锐意拼搏,成为少年AI。

盘古大模型的目标,是要帮助每家企业、每个人都拥有自己的专家助手。最终,每家企业,每个行业的AI之力涓滴成海,才能汇聚成年少有为的智能中国。

纵有千古,横有八荒。前途似海,来日方长。

只有闯出去,做实事,才能让AI技术与天不老,与国无疆。

a009c6d498ee7dd7724aa254ece2a395.gif

猜你喜欢

转载自blog.csdn.net/R5A81qHe857X8/article/details/131606381