支持鹏程系列开源大模型应用生态演化的可持续学习能力探索 - 代码天地

支持鹏程系列开源大模型应用生态演化的可持续学习能力探索

企业开发 2023-12-17 09:51:19 阅读次数: 0

【摘要】大规模预训练模型利用大规模语料以及多样化的预训练任务在自然语言处理领域取得了巨大的成功。随着大模型的逐步发展，大模型的可持续学习能力探索成为新的研究热点。主要介绍鹏程系列大模型持续学习的技术体系、应用实践以及面临的挑战，包括通过任务扩展、数据增量和知识推理的鹏程系列可持续学习技术体系，开源大模型鹏程·盘古多任务可持续学习和鹏程·通言大模型的可持续学习能力实践，大模型可持续学习过程中面临的词表更新、语义映射和知识冲突等挑战。

【关键词】鹏程系列大模型 ; 可持续学习 ; 鹏程·盘古 ; 鹏程·通言 ; 开源大模型

0 引言

近年来，鹏程系列大规模预训练语言模型（简称鹏程系统大模型）通过自监督学习的训练方式从海量语料中学习文本的上下文表示，并通过针对特定任务的小样本学习，在自然语言理解和自然语言生成等任务上都取得了惊艳的成果。

大模型具有两个显著的特点，一是模型结构足够深且参数规模庞大，二是预训练过程中伴随着多种预训练任务以保证大规模语料的有效利用。随着谷歌发布具有1～3亿参数规模的预训练的 BERT 模型，大规模预训练模型正式进入自然语言处理领域并开始蓬勃发展。随后几年，国内外研究机构发布的预训练模型的参数规模不断增长，依次出现了XLM（约2亿）、RoBERTa （约3.5亿）、MT5（约7亿）、GPT-3（约1 750亿）、华为盘古大模型（约1 000亿）、鹏程•盘古-α大模型（约2 000亿），谷歌switch transformers （约1.6万亿）、智源悟道2.0（约1.75万亿）以及阿里达摩院M6（约1万亿）等大规模预训练

猜你喜欢

转载自blog.csdn.net/weixin_70923796/article/details/134916521

支持鹏程系列开源大模型应用生态演化的可持续学习能力探索

易观：正视GPT-4功能缺陷与能力局限可更好探索大模型应用

CCF C³ 走进百度：大模型与可持续生态发展

金融生态大模型探索上新！

大模型的规模扩展是否可持续？

逼近GPT-4！BLOOMChat: 开源可商用支持多语言的大语言模型

开源大模型应用开发

从指令微调到数学推理能力，探索大模型潜力|9月14日大模型系列活动第11期

Jupyter大升级，可与大模型交互，已开源

h2oGPT：一个基于H2O.ai生态系统的开源可商用大语言模型

大语言模型系列-中文开源大模型

昆仑万维开源「天工」13B系列大模型，0门槛可商用

OpenAI开发系列（三）：OpenAI的大模型生态介绍

中文多模态大模型VisCPM ：支持对话文图双向生成，吟诗作画能力惊艳！清华系面壁智能开源...

Meta发布升级大模型LLaMA 2：开源可商用

OpenAI 大模型生态

Interview：机器学习算法工程师求职九大必备技能之【数学基础、工程能力、特征工程、模型评估、优化算法、机器学习基本概念、经典机器学习模型、深度学习模型、业务与应用】(建议收藏，持续更新)

利用RLHF优化大模型：提升性能与应用能力

大模型演化的一些思考

人工智能框架生态峰会即将召开，聚焦AI大模型技术与科学智能探索

解读未知--文档图像大模型的探索与应用

大模型应用实践：AIGC探索之旅

已经开源的中文大模型对比，支持更新

《谷歌、阿里、微软等10大深度学习CTR模型最全演化图谱【推荐、广告、搜索领域】》

论开源生态的经济模型

从工程化角度，详解鹏程·脑海大模型训练过程

使用全套开源工具构建 LLM 应用实战：在 Dify 调用 Baichuan 开源模型能力

【大模型AIGC系列课程 3-1】Meta开源大模型：羊驼系列

阿里云应用实时监控 ARMS 再升级，支持 Prometheus 开源生态

对比开源大语言模型的自然语言生成SQL能力

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)