GPT-4 leaves ChatGPT in the dust

NLP不存在了
CV不存在了
GPT-4是OpenAI最新推出的语言模型,它在GPT-3的基础上做了许多改进和创新。GPT-4的主要突破之处有:

GPT-4具有多模态能力

即它能够同时理解和生成不同类型的输入和输出,比如视频、声音、图像和文本。
虚假的多模态LLM:LLM本身不理解图像,我们先用一些图转文的工具(例如CLIP),把图片转成文字,再将这个文字拼接进Prompt中,例如“我刚给你发了一张图,图的内容是一只黑色的猫,请基于这个信息回答我的问题”

真正的多模态LLM:LLM本身理解了图像,在预训练的过程中就将图像作为其中一部分,构建了图-文的全面理解。当你给他发一张图的时候,他是真正理解了这张图。

第二种才是真正的多模态LLM,才是GPT-4的魅力
自动分析笑点:

请添加图片描述

徒手生成网页,前端工程师直接原地失业

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
自己画个网页草图,拍照自动写代码,这不就是前端工程师干的事情吗,只能说设计部分还暂时没失业,开发部分完全失业

推理能力更强

GPT-4使用了更大的数据集和更强大的计算资源,使得它能够处理更复杂的语言任务,大幅增强推理能力。

量子读论文(这个ChatGPT)也行

请添加图片描述

量子做试卷(明显比ChatGPT)强

请添加图片描述

考试在全人类前百分之十

请添加图片描述

请添加图片描述
GPT-4能够更好地遵循用户的指令,并且更少地产生错误或虚构的信息。知道问题的边界,以及给出更优质的回答
ChatGPT:
在这里插入图片描述
GPT-4
在这里插入图片描述
明显更加有思考

更加具有常识,不容易被误导
GPT-4:

在这里插入图片描述

GPT-3.5(ChatGPT):

在这里插入图片描述

长指令

大约可输入2万汉字,巨幅提高

请添加图片描述

GPT-4支持多种语言,并且能够进行跨语言转换和对话。

格式化输出

指定输出格式

请添加图片描述

人机对齐

更能知晓问题边界,不容易诱导出错误价值观答案
GPT-4:

在这里插入图片描述

GPT-3.5(ChatGPT):

在这里插入图片描述

GPT-4是人工智能领域的一次重大突破,还能说啥,只能tqltqltql

猜你喜欢

转载自blog.csdn.net/qq_44799683/article/details/129569766