卷模型技术,更要卷工程实现!

GPT、Llama 等大模型技术的屡屡突破,引爆了全球 AI 产业的新一轮震动,国内百模涌现,所有最顶尖的科研人才,都聚焦如何提升模型参数量与模型效果上。

人工智能领域专家贾扬清曾提及模型的保鲜期(Shelf life)概念,他认为从2012年 AlexNet 发布至今,在每个性能强劲的大模型发布后,只要六个月到一年左右时间,就会出现效果接近的模型。

随着更多优质的通用大模型逐渐开源,模型间的技术壁垒有望进一步消除,如何降低 AI 基础设施和模型实施的成本将成为企业、团队和个人开发者关切的话题。

这要求企业对人工智能技术有全面的认识,并对自身的基础设施和研发流程做出调整、优化,甚至重构。AI 基础设施的构建中,需要关注算力集群、数据存储、模型训练、推理部署等整条链路。在 AI 基础设施的链路中,既可以选择利用现有的云服务,也可以选择开源性质的基础设施产品进行私有化改造。

在高性能算力严重稀缺的市场环境下,一个稳健、高效的 AI 研发底座,可以充分提升团队作战效率。除了 AI 科研能力外,让研发团队具备卓越的工程能力,成了 AI 时代里打赢胜仗、弯道超车的关键。

2023年8月12日(本周六)下午,将在北京朝阳区皇家格兰云天大酒店举行程序员大会『NPCon:AI 模型技术与应用峰会——全链路搭建AI研发底座』,将于大家共同探讨:不同规模阶段的企业,如何选择适合自身的AI基础设施建设方案、高效完善AI的全链路研发流程。

858705c991852c7084ec7d147c54e726.png

完整议程

d7d70a6f123dcb45d1690ec45f456f05.jpeg

74170b3843cde3f11f7de76a60d8c5cd.png

分享嘉宾与内容简介

adb65d6b79932bd073604af9e8ee4b21.jpeg

主题演讲

《大模型涌现,如何部署训练架构与算力芯片》

国际计算机学会(ACM)、中国计算机学会(CCF)专业会员,中美发明专利约70+项,著有《GPT-4大模型硬核解读》《GPT-4核心技术分析报告》《GPGPU芯片设计》

演讲内容:

随着GPT等大模型技:术的高速成长与普及,LLM/MLM的开源资源、部署训练架构、算力成本成为大模型应用落地和企业盈亏ROI的关键分水岭,重要性不低于模型精度。本主题将分享GPT等大模型的开源Foundation Model与Finetune、开源应用平台、部署与训练架构、以及GPU和DSA芯片对部署综合成本的重要影响,场景涵盖云计算和端侧私有化部署,对互联网与MaaS企业的产品业务设计与大模型部署有关键参考意义。

主题演讲

LLM 应用技术栈与Agent全景解析

超过 11 年的互联网从业经验,对产品设计、敏捷项目管 理、DevOps、学习型组织文化与 Web 应用开发有深刻理解。近年在企业服务、工具软件领域的 SaaS 的产品、运营和技术管理上有丰富经验。

e37959ec3c7129db7deb2d7b6bdc9990.jpeg

演讲内容:

将概括目前大模型应用技术栈全景,梳理应用技术栈已实现的能力与要解决的问题、以及 Dify 等AI应用工具平台在 大模型生态中的位置及能力构建,并对当下的大模型技术发展及应用发展的趋势进行展望。

7973e3e507175d730deb7f8450a37753.jpeg

主题演讲

美团视觉GPU推理服务部署架构优化实践

美团视觉智能部,担任软件开发工程师职位,主要负责服务平台开发、视觉模型部署方案设计和GPU服务性能优化等方面的工作。同时,也非常关注人工智能领域的前沿进展和应用,积极拥抱新技术带来的变化。在工作之余,热爱骑行,非常欢迎和大家一起交流学习、探索自然享受骑行乐趣。

演讲内容:

美团视觉致力于将视觉AI技术应用于本地生活服务的各个场景。但随着在线推理服务使用的GPU资源不断增加,GPU利用率低的问题也日益凸显,导致大量计算资源浪费。经过实验分析,我们发现GPU利用率低下的推理服务存在一个共性问题:模型结构中CPU算子和GPU算子相互耦合,严重影响运行效率。为此,我们提出了一种通用高效的部署架构,通过模型结构拆分和微服务化,解决这种常见的性能瓶颈问题。目前,该解决方案已在美团视觉核心服务上成功应用,优化后服务GPU利用率接近100%,服务性能成倍提升。

主题演讲

AI大模型算力系统分析

Dr.Zhu 就职于浪潮信息人工智能与高性能应用软件部,负责大模型、AIGC等前沿AI算法研发和AI应用落地工作。

d43cb67fb57b0bea563fccc10d6164e3.jpeg

演讲内容:

结合浪潮信息源大模型的工作实践和智算中心算力平台建设经验,分享当前AI基础大模型的技术趋势、算力需求和计算特征以及当前业界面临的主要技术挑战等内容。

eec5aa74a8a639433cb75d230669c8dc.jpeg

闪电演讲

让你的 AI 应用快速落地

全栈开发者,知名开源项目 ViewDesign(iView) 创始人。

著有《Vue.js 实战》、《Vue.js 组件精讲》,组织过多次 Vue.js 活动。

演讲内容:

InsCode(inscode.net) 是一个一站式的应用开发服务平台,在 AI 的加持下,解决从开发-部署-运维-运营的全链路开发工作。

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

毕业于北京航空航天大学,从一线软件及算法工程师至创业企业CTO。

进入资本市场,多年来一直专注在Data&AI Infra方向,为多家知名创业公司提供咨询服务。

38dc6103d1b68ab1ab608780007a3239.jpeg

1a9112889944437a647aa577b1ffff7d.jpeg

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

南开大学、明尼苏达大学联合培养博士,其领导的研究团队聚焦推荐系统、信息检索、因果推断技术的前沿探索,并将预研成果在公司超过30个产品/场景落地,发表论文超过50篇,申请专利超过40项,并在ACM SIGIR、SIGKDD等学术组织担任高级程序委员/程序委员/审稿人等职务,译著《奇点临近》中文版。

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

毕业于北京航空航天大学计算机学院,一直从事NLP算法工作。

目前为智谱AI的CodeGeeX团队算法专家,专业领域为大模型训练及应用。

4d3d9d1f0ac97f373dc4f3bb2f0b20c8.jpeg

04796dbdbeb45680e685ea2077eb5134.jpeg

《开谈》圆桌

AI 时代的研发新范式

与开发者能力演进

清华大学计算机系学士、硕士;有超过10年的新技术研发和创新管理经验。曾任四达时代传媒集团研究院首席架构师,负责设计和建设覆盖非洲十余个国家的三网融合视频系统;连续创业者;拥有数十项国家发明专利。

93651e353fc59ca6cc81e16874cc9dba.jpeg

猜你喜欢

转载自blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/132241755