谷歌Bard_VS_Baize-7B_VS_文心一言体验对比 - 代码天地

谷歌Bard_VS_Baize-7B_VS_文心一言体验对比

企业开发 2023-06-05 03:38:21 阅读次数: 0

2023年4月4日，来自加州大学圣迭戈分校、中山大学和微软亚研的研究者提出了Baize，该模型是让ChatGPT 自我对话，批量生成高质量多轮对话数据集，利用该数据集对LLaMA进行微调得到的（目前版本还没有RLHF）

关于Baize的详细介绍可以参考：https://mp.weixin.qq.com/s/zxElGfclNbBwTuDG4Qrxnw

论文题目：Baize: An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat Data
论文链接：https://arxiv.org/abs/2304.01196
Github：https://github.com/project-baize/baize/blob/main/README.md
在线 Demo：https://huggingface.co/spaces/project-baize/baize-lora-7B

之前对LLM模型进行了相关的体验对比，感兴趣的可以阅读如下列表：

谷歌Bard_VS_百度文心一言

Bard vs. Bing vs. ChatGPT效果对比

文心一言 VS ChatGLM-6B对比

GPT4 VS ChatGPT，优劣势对比

下面使用Huggingface的在线demo进行体验，并且与谷歌Bard进行对比：

Note：体验的Prompt来自谷歌Bard_VS_百度文心一言

下面从ChatGLM-6B的六大方面进行测试对比

自我认知

Bard

文心一言

Baize-7B

结论：上述三个模型都有基本的自我认知

提纲写作

Bard

文心一言

Baize-7B

结论：Bard和文心一言给出了大纲的列表；而Baize-7B做了简单介绍，最后列出了NLP的相关任务；Baize-7B明显不如Bard和文心一言

文案写作

Bard

文心一言

Baize-7B

结论：Bard和文心一言都生成了一段文案，而Baize-7B只是把关键词split出来了；在生成新闻方面Baize-7B也弱于Bard和文心一言，并没有生成10个新闻，而是6个

邮件写作助手

Bard

文心一言

Baize-7B

结论：Baize-7B生成的邮件内容较短

信息抽取

Bard

文心一言

Baize-7B

结论：Bard的表现是最好的，提取信息最全，其他两个模型只提取了部分信息

角色扮演

Bard

文心一言

Baize-7B

结论：角色扮演方面Bard表现较好，而文心一言和Baize-7B几乎没有这样的能力

评论比较

Bard

文心一言

Baize-7B

结论：文心一言拒绝回答这样的问题，而Bard和Baize-7B都给出了自己的看法；

旅游向导

Bard

文心一言

Baize-7B

结论：在旅游推荐方面，上述三个模型都给出了答案，但是Baize-7B的答案没有换行，缺少条例性

猜你喜欢

转载自blog.csdn.net/wshzd/article/details/130847234

谷歌Bard_VS_Baize-7B_VS_文心一言体验对比

谷歌Bard_VS_百度文心一言

实际体验文心一言 VS ChatGPT

文心一言 vs GPT4

讯飞星火_VS_文心一言

ChatGpt vs 文心一言，谁更厉害

文心一言 VS ChatGPT ：谁是更好的选择？

文心一言内测体验

文心一言初体验

文心一言 VS 讯飞星火 VS chatgpt （43）-- 算法导论5.4 7题

国产AI大模型：智谱清言 vs. 文心一言

【AI大比拼】文心一言 VS ChatGPT-4

文心一言 VS ChatGPT，国产大模型和国外的差距有多大？

文心一言 vs GPT-4 —— 全面横向比较

文心一言 vs ChatGPT！相同 10 问，结果出乎意料

【个人首测】百度文心一言 VS ChatGPT GPT-4

文心一言 VS chatgpt （15）-- 算法导论3.2 4~5题

OpenAssistant_VS_百度文心一言

百度文心一言内测体验

ChatGPT与文心一言对比思考

文心一言和ChatGPT对比

AI平台Bard、文心一言、New Bing介绍

文心一言 VS 讯飞星火 VS chatgpt （42）-- 算法导论5.4 6题

文心一言 VS 讯飞星火 VS chatgpt （52）-- 算法导论6.2 4题

文心一言 VS 讯飞星火 VS chatgpt （51）-- 算法导论6.2 3题

文心一言 VS 讯飞星火 VS chatgpt （49）-- 算法导论6.2 1题

高考作文AI大比拼「GPT-4 vs 文心一言 vs 通义千问」

文心一言 VS 讯飞星火 VS chatgpt （48）-- 算法导论6.1 6题

文心一言 VS 讯飞星火 VS chatgpt （50）-- 算法导论6.2 2题

文心一言 VS 讯飞星火 VS chatgpt （72）-- 算法导论7.1 3题

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)