重磅推出盘古大模型3.0,助力千行百业智能升级

据数据统计,目前我国公开发布大模型超80个,大模型发展“如火如荼”来形容。大模型的兴起让 AI 有了从手工作坊走向工业化大生产的机会,然而大模型开发门槛高,算力资源消耗大,如何充分发挥大模型的潜力,普惠 AI,更好地各行各业智能化升级服务?

7月7日,在华为开发者大会2023(Cloud)上,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0,为AI重塑千行百业提供新的范式。

01 分层耦合设计,“5+N+X”三层架构

当下国内科技企业争相布局AI大模型,而华为早在2019年左右,开始立项研发盘古大模型,在2021年4月,首次发布盘古基础大模型。随后陆续发布盘古行业大模型系列,如在2021年9月发布的盘古药物分子大模型,2022年6月发布的盘古矿山大模型,同年11月发布了盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型等。

盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构,从下往上即为基础大模型、行业大模型、场景模型的架构,可以支撑我们解决通用性问题、行业性问题和细分场景的问题。

L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。

L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务、金融、制造、矿山、气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为用户训练自己的专有大模型。

L2层为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为用户提供“开箱即用”的模型服务。

从中我们看到,盘古大模型采用完全的分层解耦设计,帮助不同行业快速、灵活适配需求。张平安表示:“盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松。我们始终坚持AI for Industries的战略,在深耕行业的道路上不断前行。我坚信大模型将重塑千行百业,而每一个开发者,都将是改变世界的英雄。”

02 盘古大模型“飞入”各行各业,普惠AI

如何将AI大模型走向大规模、可复制的大工业时代?盘古大模型3.0注重实际行业难题,真正做到融入千行百业,用AI技术解决其中的问题,真正做到让 AI 惠及全社会。

如在煤矿领域,煤矿环境恶劣,危险程度高,如何用AI来替代人从事危险工作、重复劳动,从而保障人员和生产的安全?盘古矿山大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,不仅能让煤矿工人的工作环境更加舒适,而且可以极大地减少安全事故。目前,盘古矿山大模型已经在全国8个矿井规模使用。

在政务领域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手小福,能够精准理解民众咨询意图,改变传统的一网通办模式,把老百姓的话语转化为政府办事的语言。盘古政务大模型对超过20万条政务数据进行精调,包括12345热线、政策文件、政务百科等,掌握了丰富的法律法规、办事流程等行业知识。

在药物研发领域,原来一款新药研发平均需要10年时间、花费10亿美金。盘古药物分子大模型可大幅提升药物研发效率,助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70%。

在气象领域,盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型,同时预测速度也有大幅提升。原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。将应用于航空/航天、海运、农业、交通出行、新能源等行业产生更多价值。

在铁路领域,盘古铁路大模型能精准识别现网运行的67种货车、430多种故障,无故障图片筛除率高达95%,成为货运列检员身边有力的数字助手,将列检员从每日数百万张的“图海”检测中解放出来。

在金融领域,盘古金融大模型可以对银行的各种操作、政策、案例文档进行预训练,能根据客户的问题,为柜台工作人员自动生成流程和操作指导,将原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上。盘古大模型让数十万网点柜员都拥有自己的智慧助手。

在制造领域,过去单产线制定器件分配计划,往往要花费3个小时以上才能做齐1天的生产计划。盘古制造大模型学习了华为产线上各种器件数据、业务流程及规则以后,能够对业务需求进行准确的意图理解,并调用天筹AI求解器插件,1分钟即可做出未来3天的生产计划。

除了以上案例外,在部署场景上,盘古大模型3.0提供基于公有云和混合云的综合方案来适应不同行业的部署需求。总的来说,盘古大模型有效解决传统AI开发的难题,其泛化性能高、高效样本标注、精准度高、可解决碎片化问题、降低AI开发门槛,助力千行百业。

03 盘古大模型深度融合华为云产品

华为一直秉持“自己的降落伞自己跳”的原则,盘古大模型也不例外,现在盘古大模型深度融入了华为云的产品服务,帮助产品创新。

如盘古大模型赋能华为云CodeArts代码工具,发布智能编程助手CodeArts Snap。该工具训练了760亿行精选代码、1300万篇技术文档,具备智能生成、智能问答、智能协同三大核心功能,现场演示了CodeArts Snap可以实现一句对话让代码生成、一次点击即可自动注释和生成测试用例,一条指令即可智能部署。

通过盘古大模型赋能MetaStudio数字内容生产线,打造了盘古数字人大模型,提供模型生成和模型驱动两大服务,并已经使用了20万小时音视频数据进行了预训练。基于这两大服务,开发者可以快速生成和驱动数字人模型,赋能在线教育、文娱直播、企业会议等行业应用,让每个企业员工实现“数字人自由”。例如,用户只需在华为云MetaStudio的服务页面上传20秒的个人视频,就可以快速生成个性化的数字人讲解视频,过去3个研发人员3天完成的工作,现在只需要3分钟就可以完成。

通过本次盘古大模型3.0的发布,可以看到华为云在技术和应用上赋能业务创新,不断夯实行业智能化底座,助力千行百业智能升级。

猜你喜欢

转载自blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/131645218