ChatGPT的真相：强泛化的秘密以及众多关键问题 - 代码天地

ChatGPT的真相：强泛化的秘密以及众多关键问题

企业开发 2023-06-21 18:51:18 阅读次数: 0

本文从ChatGPT带来的即时学习能力（in-context learning）入手，逐步深入地探讨了ChatGPT目前众多的关键性问题，包括：

1. ChatGPT带来了从未有过的计算层次——虚拟人
2. ChatGPT带来的新的智能计算构架：母体和虚拟人
3. 在人类语料知识用尽的时候，新的智能架构如何成长，如何吸收新的技能
4. 强泛化能力的解释，以及大模型能力涌现的可能原因
5. 一本正经胡说八道问题的原因和长、短期解决方案
6. ChatGPT如何细化到垂直领域，比如法律领域。

本文并不是对已发表的大模型论文的技术总结，不是一篇综述文章，而是基于笔者自己的研究分析去探索上述问题的答案。希望能起到一个抛砖引玉的作用。文章的写作跨度比较长，大部分的写作完成于OpenAI推出plugins功能之前，所以有少部分技术内容显得有些滞后了。

1 ChatGPT带来的崭新技术：

即时学习能力

在OpenAI的GPT-3出现之前，以往的深度学习模型只是为某个特定任务开发的，比如，翻译、分类、摘要、信息抽取等等。每个任务都有一个专用的模型，都需要人类标柱员专门为这个任务生成大量的标注数据用来训练模型。而OpenAI采用自监督的方式来训练它的超级大模型GPT-3，不需要任何人类标注数据。它使用了巨量的50TB的文字语料，其中大部分来自于互联网。而它所做的唯一一件训练任务就是根据文本中前面看到的文字，不断的预测下一个文字是什么。

这个1750亿参数的模型充分训练

猜你喜欢

转载自blog.csdn.net/qq_41771998/article/details/130300166

ChatGPT的真相：强泛化的秘密以及众多关键问题

关于ChatGPT的几个关键问题

cache关键问题

CSS关键问题

Promise关键问题

tag推荐系统的关键问题以及解决方案

IPFS的几个关键问题

深度学习关键问题

tensorflow 关键问题辨析

RocketMQ关键问题研究

Promise关键问题分析

Promise 二：关键问题

Promise详解与关键问题

【嵌入式系统应用】实验关键问题，以及关键代码

继承UIView时使用xib文件布局的方法以及关键问题

python+opencv安装方法，以及关键问题解决

Keras模型可视化教程及关键问题解决

文生图关键问题探索：个性化定制和效果评价

项目管理的20个关键问题

学习理解SpringSecurity的几个关键问题

【JavaScript】Promise（二） —— 几个关键问题

区块链相关技术、概念以及技术实现过程中的一些关键问题 Smart Contracts and Blockchains

ChatGPT背后的指令学习是什么？PSU最新首篇《指令学习》技术全面综述，详述指令学习关键问题

QT关键问题解决之paintevent理解

帮助企业削减AI 炒作的6个关键问题

拥抱BIM，GIS需解决哪些关键问题

【CV.SLAM之十五】关键问题

分布式存储系统关键问题

区块链技术应用的关键问题和挑战

大数据面试题---关键问题总结

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)