2023年6月第3周大模型荟萃

2023.6.20
版权声明：本文为博主chszs的原创文章，未经博主允许不得转载。

1、Meta 开源 AI 语言模型 MusicGen

6月12日讯，Meta 近日在 Github 上开源了其 AI 语言模型 MusicGen，该模型基于 Transformer 模型，如模型名称所示，MusicGen 主要用于音乐生成，它可以将文本和已有的旋律转化为完整乐曲。除此之外，MusicGen 还支持文本与旋律的组合输入，例如你可以提出生成“一首轻快的曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来”。

根据对 MusicGen 实际表现的测试结果显示，与谷歌的 MusicLM 以及 Riffusion、Mousai、Noise2Music 等其他音乐模型相比，MusicGen 在测试音乐与文本提示的匹配度以及作曲的可信度等指标上表现更好，总体而言略高于谷歌 MusicLM 的水平。

项目地址：https://github.com/facebookresearch/audiocraft
Demo地址：https://huggingface.co/spaces/facebook/MusicGen

2、Stability 推出新应用 Uncrop Clipdrop 扩展图像

Stability AI 联合 Clipdrop 于近日推出了 Uncrop Clipdrop 工具，这是一个图像比例编辑器。可以把竖图变横图，横图变竖图，任意调整图像比例。

Uncrop 从功能上来说，和 Photoshop Generative Fill 非常类似，其本质功能都是利用 AI 在指定的位置创造出图像内容。两者相比较，PS GF 不止能外扩图片，还能在指定的位置根据要求创造出图像。如果用户想要对图像的细节进行更加精准的修改，PS GF 在功能上还是有很大的优势。但如果只是需要扩展一部分图片内容，Uncrop 已经能很好的满足要求了，而且 Uncrop 操作简单且完全免费！

3、Adobe 生成式 AI 工具 Firefly 推出企业版

Adobe 在其 EMEA 2023 峰会上，推出了 AI 图像生成工具 Firefly 企业版。新版本主要面向大型企业 —— 企业可以使用自身的数据资产，训练自己的 Firefly 大模型，快速生成可安全商用的图像内容。

官网显示，企业版 Firefly 将于今年下半年正式发布，但企业用户已经可以在企业版 Adobe Express 中使用 Firefly 的功能。

Firefly 是 Adobe 于 2023 年 3 月发布的 AI 图像生成套件，和不少 AI 绘画工具类似，用户用 Prompt（提示词）就可以进行图像生成，或是进行图像风格的替换和修改。5 月底，Firefly 正式开放公测，并被集成至 Photoshop 的创意填充功能中，该功能目前已被使用生成了超过 1.5 亿张图像。确保商业上得以安全使用，是这款新产品的一大卖点，也是 Adobe 推出 Firefly 一直以来的重要考虑因素。用以训练 Firefly 模型的数据内容均来自于 Adobe Stock 图像、公开许可内容和其他版权过期的公共领域内容—— Adobe 拥有对这些图像的所有权利，而不会涉及版权纠纷问题。与此同时，因未经创作者知情或同意抓取图像并用于训练，Stability AI、Midjourney 等人工智能图像生成开发商正面临着日益增加的诉讼。今年1月，华盖创意便起诉 Stability AI，称其非法窃取数百万张图片，侵犯版权。

4、新华三发布私域大模型“百业灵犀”LinSeer

新华三于 6 月 11 日发布私域大模型 ——“百业灵犀”LinSeer，为垂直行业和专属地域的客户，提供安全、订制、独享、生长的智能化服务。该大模型打通垂直应用数据，形成精准、精确、精益的私域垂直智能，培养特定能力，但无法做到通用。

总结来说就是，新华三推出面向大模型训练的 AI 服务器，可自选多种开源大模型，结合企业的私有数据，最终形成企业私有的大模型服务。

5、字节今年向英伟达订购超 10 亿美元 GPU

据《晚点 LatePost》了解，今年春节后，拥有云计算业务的中国各互联网大公司都向英伟达下了大单。字节今年向英伟达订购了超过 10亿美元的 GPU（包括到货和没到货的 A100 与 H800），另一家互联网大厂向英伟达下的万卡级别订单按目录价估算也至少超过 10 亿元人民币。仅字节一家公司今年的订单可能已接近英伟达去年在中国销售的商用 GPU 总和。

据了解，字节、腾讯、阿里、百度这四家中国投入AI和云计算最多的科技公司，过去 A100 的积累都达到上万块。其中字节的 A100 绝对数最多。不算今年的新增订单，字节 A100 和前代产品 V100 总数接近 10 万块。

东吴证券、天风证券、浙商证券、国联证券、华西证券、东方证券、安信证券等证券研究机构今年都发表过大模型算力需求会驱动国内服务器厂商受益的研报，这则消息相当于间接打脸了，受益的仍然是头部外企英伟达。

6、360公司发布“智脑4.0”，并全面接入 360 全家桶

6 月 13 日 360 公司召开发布会，展示认知型通用大模型“智脑4.0”，宣称其在多模态等关键能力上完成迭代，将全面接入“360全家桶”，并国内首发“文生视频”的多模态功能。周鸿祎认为，国内已进入百模大战，重要的是应用场景的比拼；另外，国内要弯道超车，关键在于发展多模态，目前360已具备跨模态生成能力，可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。

与此同时，还发布了360 AI 数字人。畅想了 360 AI 数字人未来的发展方向是生成声音、视频并拥有长期记忆，甚至拥有目标分解和规划的能力，并且拥有“手和脚”，具备执行力，更好为人类提供服务。360 AI数字人目前拥有200多个角色，分为数字名人和数字员工两类。数字名人包括历史人物、偶像明星、文学形象等，数字员工则可成为企业员工的知识助手和办公助手。360 AI数字人支持定制，每个人都能通过上传私人知识库，低成本生成自己的专属数字人，如数字分身、数字助理、数字偶像等。

7、《人工智能法》草案即将到来

6 月 10 日，《人工智能法》草案进入国务院 2023 年度立法工作计划，预备年内提请全国人大常委会审议。人工智能领域立法可以确保人工智能技术的安全和可信使用。立法可以明确责任归属方法或原则，保护人权，防止人工智能的滥用，确保智能决策过程更加公开透明，防止不公平和歧视的现象，保护公共利益，预防未来风险。风险类型主要包括数据安全、网络舆情威胁、算法歧视、个人信息泄露、知识产权侵权、诱发网络犯罪、技术垄断以及侵蚀教育体系等。不过，这些风险大多还是停留于猜想和假设层面，尚未实际发生，这些风险的发生概率同样未有定论。

8、百川智能开源 70 亿参数量的中英文预训练大模型

2023年6月15日，搜狗创始人王小创立的百川智能公司，推出了 70 亿参数量的中英文预训练大模型 baichuan-7B。据悉，北京大学和清华大学已率先使用 baichuan-7B 模型推进相关研究工作，并计划在未来与百川智能深入合作，共同推动 baichuan-7B 模型的应用和发展。

baichuan-7B 不仅在 C-Eval、AGIEval 和 Gaokao 中文权威评测榜单上，以显著优势全面超过了 ChatGLM-6B 等其他大模型，并且在 MMLU 英文权威评测榜单上，大幅领先 LLaMA-7B。目前 baichuan-7B 大模型已在 Hugging Face、Github 以及 Model Scope 平台发布。本次发布也遵循开源精神，baichuan-7B 代码采用 Apache-2.0 协议，模型权重采用了免费商用协议，只需进行简单登记即可免费商用。

9、斯坦福6月最新LLM排行榜发布

最近，来自斯坦福的研究人员提出一个基于大语言模型的全新自动评估系统 —— AlpacaEval。不仅速度快、成本低，而且还经过了2万个人类标注的验证。

Model Name	Win Rate
GPT-4	95.28%
Claude	88.39%
ChatGPT	86.09%
WizardLM 13B	75.31%
Guanaco 65B	71.80%
Vicuna 13B	70.43%
LLaMA 33B OASST RLHF	66.52%
Guanaco 33B	65.96%
Nous Hermes 13B	65.47%
Vicuna 7B	64.41%
LLaMA 33B OASST SFT	54.97%
Guanaco 13B	52.61%
Davinci003	50.00%
Guanaco 7B	46.58%
Falcon 40B Instruct	45.71%
Alpaca Farm PPO Sim (GPT-4) 7B	44.10%
Pythia 12B SFT	41.86%
Alpaca Farm PPO Human 7B	41.24%
Alpaca 7B	26.46%
Pythia 12B OASST SFT	25.96%
Falcon 7B Instruct	23.60%
Cohere	17.52%
Davinci001	15.17%