机器学习：GPT3 - 代码天地

机器学习：GPT3

业界资讯 2023-08-18 21:14:21 阅读次数: 0

在这里插入图片描述

GPT3

模型过于巨大
在这里插入图片描述
GPT3是T5参数量的10倍！

训练GPT3的代价是$12百万美元

Zero-shot Ability

在这里插入图片描述
GPT3的思想是不是能拿掉Fine-tune

只需要给定few-shot或者zero-shot就能干相应的任务了。

few-shot learning（no gradient descent）：给一点点的prompt
one-shot learning：给一个prompt
zero-shot leaning：什么都不给

few-shot 是没有微调模型的，没有梯度下降，这些文字是让模型知道做什么。

将这种能力叫做”In-context Learning“
在这里插入图片描述
GPT3在42个任务上的表现，随着模型参数越来越大，模型性能越来越好。

相关能力

Closed Book QA

在这里插入图片描述
闭卷直接问，比如说喜马拉雅山的高度是多少，few-shot learning 超过了fine-tuned sota。

在这里插入图片描述
随着few-shot给的数量越多，性能越来越好。

在这里插入图片描述
GPT3也可以做生成相关的任务，比如生成文章。产生的新闻可以骗过人类。

gpt3能做数学相关的任务，使用模型的参数越大，正确率也越高，两位数的加法和两位数的减法上表现非常好，三位数的减法也不错，加法效果要差一点，更困难的就效果比较差了。

在这里插入图片描述
在zero-shot和one-shot效果不行，在few-shot上效果要好一点，在ANLI的任务上效果不好，即给定两个矛盾的句子，判断两个句子是否矛盾。

在这里插入图片描述

训练数据是从网上爬取的数据，但是无法避免爬取的内容中是否含有任务的数据，相当于拿问题的数据进行训练再来回答任务的数据。

clean data：gpt3没有看过这些数据
dirty data：gpt3有看过这些数据

Turing Advice Challenge

在这里插入图片描述
gpt3给建议。

在这里插入图片描述

与人类的建议做一些比较，效果还一般。

GPT产生图像，一行一行的产生图像。

猜你喜欢

转载自blog.csdn.net/uncle_ll/article/details/131927763

机器学习：GPT3

GPT3学习笔记

GPT3与机器学习：探讨如何提高AI的识别与分类能力

GPT3和GPT4

GPT系列学习笔记：GPT、GPT2、GPT3GPT系列学习笔记：GPT、GPT2、GPT3

【chatgpt】chatgpt APi使用 GPT3

OpenAI Python API 训练营：学习使用 AI、GPT3 等！

gpt模型训练-gpt3模型详解

辨别GPT4和GPT3

关于GPT3的一些思考

GPT3：人工智能时代的新型语言模型

GPT 模型介绍 | GPT3 / GPT3.5 + Flask | Github源码链接

gpt3官网中文版-人工智能软件chat gpt安装

gpt中文版下载-gpt3中文自动生成小说

GPT3是否会改变传统IT行业的工作形式吗？

浅尝基于 GPT3 模型的 IDE: Cursor 用法全解读

Windows环境下如何用GPT3微调自己的模型

(GPT3)Language Models are Few-Shot Learners论文阅读

人工智能大模型原理与应用实战：从BERT到GPT3

OpenAI GPT3.5/GPT3 + Flask 制作自己的交互网页教程 | 附源码和 Github链接

一招鉴别真假ChatGPT，并简要介绍ChatGPT、GPT、GPT2和GPT3模型之间的区别和联系

千乎万唤始出来，支持gpt3和gpt4支持画图，的在线gpt应用接入案例开源上线啦

每天生产45亿词，GPT3已渗透300+应用，网友：边吃边拉

中文版GPT3——CPM(2.6B)微调长短文本生成(对应小说歌词)

大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解

【Docker】快速部署 ChatGPT Next Web，一键免费部署你的私人 ChatGPT 网页应用，支持 GPT3, GPT4 & Gemini Pro 模型。

Chat GPT模型GPT-3学习

[最新]0代码完成ChatGPT本地部署/免费网页访问/调用open AI的API/GPT3/GPT3.5/GPT4模型[附无法访问https://api.openai.com解决办法]

AI很渴：chatGPT交流一次=喝掉一瓶水，GPT3训练=填满核反应堆

浅析人类最贵、最大的机器学习模型GPT-3及背后隐含的商业逻辑

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)