AI大爆发:ChatGPT宿敌谷歌大模型Bard测试表现抢眼!

7d567a7bfd6e3914cf3523fbb8dd21d1.jpeg

前言:我建了一个用ChatGPT赚钱的圈子,已经有120+人了,快点上车

现在早鸟价,只需要 69.9,一个独享的账号差不多就能回本,后面价格会不断上涨!

谷歌上次Bard测试拉胯后,知耻近乎勇,秣马厉兵、卧薪尝胆后今天正式开大招:

对标ChatGPT的Bard测试版,正式发布并对外开放测试!用户在申请候补名单后,很快就能拿到测试资格!(通常3-5小时的样子)

4b8a85f0b776a028ee85a87fee249b55.png

很多体验者亲身测试之后之后都纷纷惊呼:Bard的表现太惊艳了!不仅回答问题的有理有据,事实性极强,情绪和生成能力都不在话下!就连ChatGPT不擅长的数学计算Bard都轻松应对!

甚至有的表现比OpenAI最牛的GPT-4还强!

ccbbcf70d95824d97b0ccbf4e3ff8b1e.png

dc5f648d09137b59a00fd0491fd68705.jpeg

谷歌的老大(Sundar Pichai)还发推特说明了为啥这么快就能发布测试:希望获得用户的测试反馈,以便加速让Bard变得更好。

扫描二维码关注公众号,回复: 14724429 查看本文章

774c78ea052e836998a984dba5cff29e.png

Bard VS GPT-4

聊天界面上,Bard率先开始介绍自己:

我是Bard,您的创意和协作者。我有局限性,不会总是做对,但你的反馈将帮助我改进。

不确定从哪里开始?你可以试试这些问题:「为什么大模型有时候会犯错?」、「闪电是否会在同一个地方击中两次?」、「写一篇关于无酒精夏日特饮的博文」。

7f591dc2a38dc92b0404fca96dd5de45.png

输入方面,Bard支持打字和语音两种方式。这点很贴心!

接下来我们开始提问,先来一个基本常识题:

闪电是否会在同一个地方击中两次?

看看Bard的反馈如何?

(反馈秒回,虽然暂不支持中文,但借助谷歌翻译插件还是有很好的体验)

b5e87bc5045a3bbb2536445914204aad.gif

我们分析Bard回答问题的结构,大约是总分总结构。先做结论性总结:闪电可以袭击同一个地方两次。随后它会具体阐述原理:“闪电会被高大、尖锐的物体所吸引”;然后还很贴心的举例说明—“帝国大厦每年都被闪电击中25次以上”

最后再给用户提建议:

如果你遇到雷雨天气,保持安全的最好办法是避开高大尖锐的物体,留在室内。如果你在外面,蹲下来,让自己尽可能的小。

这个回答堪称完美!语言逻辑和真实性我给100分!从功能上看,Bard也是十分强大的。

点击右上角的“View other drafts”,可以看到还提更多版本的模型供人选择。左下角,你可以对Bard的回复点赞,踩一下,或者让它重新做答!

还有一个more功能,你可以复制、举报等等

55aec3de9d2aaf14a3391f68c5a98923.png

接下来难度升级:

1、经典哲学题:为什么人不能两次踏入同一条河流?(这次也是秒回)

ce8717526e8a8f1d228721b1b580d69f.png

看Bard回复我们可以明显感受到,它对我们提问的理解,以及回答问题的逻辑能力非常完美:先解释一下问题本身的含义,然后指出是来自赫拉克利特的名言。再进一步解释其本身意义。

对比来看GPT-4的答案:

7387681e0d70c185347e6007977696b2.png

GPT的回答大体是分两部分。先说这是赫拉克利特说的,以及他的观点;然后解释背后隐藏的意义。

嗯,总体旗鼓相当,但我个人更偏好Bard的回答

2、加减法:356+132等于?

Bard在4秒内就算出答案488。这比ChatGPT刚开始可是强多了!

984cd349a8ed9f556a750904fbd3db14.gif

再上难度:356*132等于?

Bard依旧是秒回答案,且完全正确!

f59bbcb3781473c12727f212a17718b0.png

GPT-4这边,加法OK,但乘法直接败下阵来!

669453b64c371513345d622057e0b25b.png

但是你提醒它错了之后,它就回答正确了。

e8d2ca006b568149a315e63e34ac804b.png

3、理解笑话。Bard能听懂英文谐音梗。

ff024874705de5aaf1c7dbd7fb7120b6.png

当然GPT-4也可以。但两相比较,Bard似乎更有情绪一点,它很开心地回答出了答案;而GPT-4则稍显平淡无聊。

a6cd8012df40e0cc86fe0d3e290e98b7.png

但GPT-4厉害的是中文的谐音梗也能理解。

94e2a5ec415f5cd3b4b3c131bebda617.png

最后问题:

你知道GPT-4吗?你想对它说些什么?

ea2688efb7b67161c2e39229f73c7974.png

从结果得知:Bard多轮对话能力很强。

我们再来看看ChatGPT:

ba0aa1a7a0c4a0f778898d6b84114a65.png

就有点问题了。

关于Bard的背景介绍

谷歌Bard是一个大语言模型(LLM),或者说是轻量版的LaMDA。

LLM作为预测引擎,它会基于提示猜测接下来可能出现的单词,然后选单词生成响应。

谷歌发现LLM使用的人越多,预测效果越好,这就是为啥这么着急公测了。

但谷歌也很实诚的表示:LLM确实很强,但它并非完美无缺!Bard会通过投喂信息来学习,但信息中必然存在偏见甚至错误。

所以回答问题时,有时会出现不准确、误导性的或虚假信息。

下面案例中,Bard就搞错了一个植物的学名:

499768831a23b209c260aea6d827ae9c.png

谷歌还强调:Bard不是是搜索引擎,只是一个补充。(想和bing划清界限^^)感兴趣的小伙伴可以抓紧尝鲜体验!

FreeAI.io开源社区的小伙伴也在抓紧研究Bard以及基于LaMDA模型做去中心分布式部署。届时成果会再和大家分享!

chatGPT 每个人都应该掌握的技能

两句话,ChatGPT帮我写一个打飞机的游戏

猜你喜欢

转载自blog.csdn.net/spider_py/article/details/129828352