阿里大模型——通义千问

目录

前段时间世界人工智能大会在上海举行,我去参观感受了一下,整个感受是有点名不副实的,参展的有各种银行、车企、还有中国电信、联通三个运营商都来凑热闹了。

在这里插入图片描述

但是也有Google、华为、阿里、腾讯、商汤这样的大厂。现场也可以体验一些大厂开发的大语言模型。例如阿里的通义千问、百度的文心一言,这些感觉生成效果都不错。还有华为的盘古大模型,尤其是盘古气象大模型,听说效果不错,研究成果还发布到了《Nature》

ok,今天就来介绍一下阿里的通义大模型。

阿里的通义大模型是达摩院自主研发的超大规模语言模型,包括了:
• 通义千问(内容生成)
• 通义听悟(音频处理)
• 通义万相(AI绘画)
我申请体验了一下,没想到第二天就申请通过了,速度还是挺快的,大家也可以申请体验一下:https://tongyi.aliyun.com/

我体验了一下通义千问这个模型,在一些常规问题上的效果还不错,但是在逻辑理解、代码理解能力还有些不足。例如给它一个算法题,给出的代码甚至不能通过编译,并且无法完成代码的纠错。而ChatGPT给出的代码一次即可通过测试。​

通义千问是类似ChatGPT一样的文本内容生成模型。
在这里插入图片描述

做一份旅游攻略
在这里插入图片描述

代码生成
实现一个快速排序:
在这里插入图片描述

给它一个Leetcode算法题(最长回文子串),把它的代码测试运行一下,发现编译都报错…

在这里插入图片描述

然后我发现它给出的代码中不知道为什么要用一个int变量减去一个布尔值
在这里插入图片描述

然后它就一直重复回答…

同样的prompt,我们看下ChatGPT的效果:

在这里插入图片描述

ChatGPT给出的代码放在Leetcode上可以直接运行成功,通过测试。
在这里插入图片描述

让ChatGPT成功指出通义千问代码的错误,并且修正后的代码运行测试通过。
在这里插入图片描述

而通义千问对代码的理解能力却有待提高:
在这里插入图片描述

并且UI还有显示的BUG:
在这里插入图片描述

内容创作
这效果差的不是半点啊

在这里插入图片描述
在这里插入图片描述

另外我还体验了通义万相,是AI绘画类模型,但是生成的效果和MidJourney、Stable Diffusion这些差了一些。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/DreamsArchitects/article/details/131692535