讯飞星火认知大模型的“修炼秘诀”是什么？

讯飞星火认知大模型自今年5月发布后，拥有文本生成、语言理解、逻辑推理、知识问答等七项核心能力。6月再次升级发布星火认知大模型V1.5，在教育、办公、汽车、医疗、工业等领域落地，并实现从0到1的创新也用,目前该模型正快速向特定行业的专精领域拓展，将为智能客服、智慧营销、智慧运营等应用场景提供更强大的能力。

讯飞星火认知大模型被后的“修炼秘诀”是什么？

大模型时代赋予算法、数据、算力三大要素新意义

人工智能三大核心要素大家已经很熟悉：算法、数据、算力，大模型时代赋予三要素新的意义：大模型、大数据、大算力。

算法：系统性创新驱动认知智能大模型这一典型的复杂智能系统

我们之前提出过：目前AI落地产业的阶段，单项技术即使做得足够优秀也对产业价值带来不了太大的变化；在单点核心技术效果做好并跨越应用鸿沟的基础上，系统性创新——即实现创新链条上各关键技术的深度融合，才能解决重大的社会、科学命题或产业需求。

对于认知智能大模型来说，系统性创新同样有重要的驱动意义：不论是在相关领域技术方面的深厚积累，还是在团队上拥有关键算法创新的两个核心策源地——认知智能全国重点实验室、语音及语言信息处理国家工程研究中心，都在算法层面为讯飞星火认知大模型打下了坚实基础。

数据：大模型对数据的“质”与“量”有更高依赖

随着大模型参数规模增大，训练的数据量也在迅速增长，大模型表现出的海量知识记忆能力也严重依赖训练数据的质量；在此基础上，各个场景数据的有效利用，能够帮助大模型实现智能涌现。

认知智能带来的智能涌现也受到数据涟漪效应的推动和加速。目前，认知智能的数据标注工程从劳动密集型向知识密集型转变，源源不断的增量知识数据为大模型智能涌现打下坚实基础。

讯飞星火认知大模型为“1+N”体系，“1”是通用认知智能大模型，“N”是大模型在教育、办公、汽车、人机交互等各个领域的落地。二者并进，“N”的数据和场景可以更新到“1”里、促进通用大模型的能力迭代提升；“1”的能力也能快速迭代融入到“N”的产品应用中去，实现更快速的落地。

在讯飞一贯坚持的“平台+赛道”发展战略之上，我们充分利用数据涟漪效应，加速机器的智能涌现。

算力：没有算力万万不能，但大算力未必万能

大模型对算力展现出了比以往更强烈的需求，可以说大模型时代没有算力万万不能，但大算力未必万能，大模型的发展还需要全面考虑其他相关因素。

目前，讯飞根据大模型训练和服务的技术挑战与需求，重新设计打造了大模型专用的一体化平台来支持混合异构算力调度，打通训练推理资源数据闭环。

讯飞星火认知大模型为何能在半年内研发出来？

围绕刚提到的算法、数据、算力三大核心要素，讯飞拥有完整的基础资源、研究引擎、开放平台、多个行业的规模化应用，再加上成建制的团队，最终齐心协力成功研发出讯飞星火认知大模型。
从2011年语音与语言信息处理国家实验室成立开始，2014年提出“讯飞超脑”计划， 2017年认知智能国家重点实验室获批，2022年进一步推出“讯飞超脑2030”计划，讯飞在认知智能和大模型方向持续深耕，拥有十余年的技术积累；

其次，我们通过拥有400多万开发者团队的讯飞开放平台和多个真实应用的行业赛道，实现了场景积累。因此在发布星火认知大模型“1”的同时，也迅速推出“N”的落地应用成果。

讯飞研究院的院训是“用正确的方法，做有用的研究”，这句话也适用于讯飞星火的研发。有了全面对标ChatGPT的48项主要任务的明确目标，在清晰的技术路径指引下，我们最终实现从0到1的突破。

除了技术能力的升级目标之外，场景与应用落地结合也会影响技术驱动的方向。我们认为大模型的应用落地面对的并不是存量市场，因为大模型掀起的产业变革带来了巨大空间，重构出了新的市场，这也是下一步我们努力探索和实践的方向。