讯飞星火认知大模型的“修炼秘诀”是什么?

讯飞星火认知大模型自今年5月发布后,拥有文本生成、语言理解、逻辑推理、知识问答等七项核心能力。6月再次升级发布星火认知大模型V1.5,在教育、办公、汽车、医疗、工业等领域落地,并实现从0到1的创新也用,目前该模型正快速向特定行业的专精领域拓展,将为智能客服、智慧营销、智慧运营等应用场景提供更强大的能力。

讯飞星火认知大模型被后的“修炼秘诀”是什么?

大模型时代赋予算法、数据、算力三大要素新意义

人工智能三大核心要素大家已经很熟悉:算法、数据、算力,大模型时代赋予三要素新的意义:大模型、大数据、大算力

  • 算法:系统性创新驱动认知智能大模型这一典型的复杂智能系统

我们之前提出过:目前AI落地产业的阶段,单项技术即使做得足够优秀也对产业价值带来不了太大的变化;在单点核心技术效果做好并跨越应用鸿沟的基础上,系统性创新——即实现创新链条上各关键技术的深度融合,才能解决重大的社会、科学命题或产业需求


对于认知智能大模型来说,系统性创新同样有重要的驱动意义:不论是在相关领域技术方面的深厚积累,还是在团队上拥有关键算法创新的两个核心策源地——认知智能全国重点实验室、语音及语言信息处理国家工程研究中心,都在算法层面为讯飞星火认知大模型打下了坚实基础。

  • 数据:大模型对数据的“质”与“量”有更高依赖

随着大模型参数规模增大,训练的数据量也在迅速增长,大模型表现出的海量知识记忆能力也严重依赖训练数据的质量;在此基础上,各个场景数据的有效利用,能够帮助大模型实现智能涌现。


认知智能带来的智能涌现也受到数据涟漪效应的推动和加速。目前,认知智能的数据标注工程从劳动密集型向知识密集型转变,源源不断的增量知识数据为大模型智能涌现打下坚实基础。


讯飞星火认知大模型为“1+N”体系,“1”是通用认知智能大模型,“N”是大模型在教育、办公、汽车、人机交互等各个领域的落地。二者并进,“N”的数据和场景可以更新到“1”里、促进通用大模型的能力迭代提升;“1”的能力也能快速迭代融入到“N”的产品应用中去,实现更快速的落地。


在讯飞一贯坚持的“平台+赛道”发展战略之上,我们充分利用数据涟漪效应,加速机器的智能涌现。

  • 算力:没有算力万万不能,但大算力未必万能

大模型对算力展现出了比以往更强烈的需求,可以说大模型时代没有算力万万不能,但大算力未必万能,大模型的发展还需要全面考虑其他相关因素。


目前,讯飞根据大模型训练和服务的技术挑战与需求,重新设计打造了大模型专用的一体化平台来支持混合异构算力调度,打通训练推理资源数据闭环。


讯飞星火认知大模型为何能在半年内研发出来?


围绕刚提到的算法、数据、算力三大核心要素,讯飞拥有完整的基础资源、研究引擎、开放平台、多个行业的规模化应用,再加上成建制的团队,最终齐心协力成功研发出讯飞星火认知大模型。
从2011年语音与语言信息处理国家实验室成立开始,2014年提出“讯飞超脑”计划, 2017年认知智能国家重点实验室获批,2022年进一步推出“讯飞超脑2030”计划,讯飞在认知智能和大模型方向持续深耕,拥有十余年的技术积累;

其次,我们通过拥有400多万开发者团队的讯飞开放平台和多个真实应用的行业赛道,实现了场景积累。因此在发布星火认知大模型“1”的同时,也迅速推出“N”的落地应用成果。


讯飞研究院的院训是“用正确的方法,做有用的研究”,这句话也适用于讯飞星火的研发。有了全面对标ChatGPT的48项主要任务的明确目标,在清晰的技术路径指引下,我们最终实现从0到1的突破。


除了技术能力的升级目标之外,场景与应用落地结合也会影响技术驱动的方向。我们认为大模型的应用落地面对的并不是存量市场,因为大模型掀起的产业变革带来了巨大空间,重构出了新的市场,这也是下一步我们努力探索和实践的方向。

猜你喜欢

转载自blog.csdn.net/AI_Platform/article/details/131826177