2023年5月第4周大模型荟萃

2023.5.31
版权声明：本文为博主chszs的原创文章，未经博主允许不得转载。

1、AI 图像编辑技术 DragGAN 问世

近日，来自 Google 的研究人员与 Max Planck 信息学研究所和麻省理工学院 CSAIL 一起，发布了一个名为 DragGAN 的图像编辑工具。这是一个非常直观的图像编辑工具，用户只需要控制图像中的像素点和方向，就可以让图像变形。这种工具的潜力在于，从文本生成图像的人工智能并不总是能输出你想要的结果，所以你可以在生成图像之后再进行编辑，而不必重新生成一个新的图像。

官网：https://vcai.mpi-inf.mpg.de/projects/DragGAN/
Github主页：https://github.com/Zeqiang-Lai/DragGAN（非官方版本）

点评：目前此技术还停留在 Demo 阶段，但是已经展现出美好的愿景。

2、国产中文大语言模型 “天河天元” 发布

国家超算天津中心在第七届世界智能大会上发布了天河百亿亿级智能计算开放创新平台和国产中文大模型“天河天元”。中文大语言模型的数据集较为稀缺。国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据，以及专业领域的中医、医药、问诊、法律等多种数据集，训练数据集总 token 数达到 350B，训练打造了自己的中文语言大模型。未来，国家超算天津中心还将在 “天河天元大模型” 的基础上启动深度训练面向医疗、工业、法律等领域的专业模型。未来大模型将在深度学习平台的支撑下成为产业智能化基座。

点评：目前仅是一个吹嘘会，表明自己有，反正老百姓用不了，也没开放使用，想怎么吹就怎么吹。

3、微软发布 Windows Copilot

5月23日，微软在当晚的Build 2023大会上宣布，Windows Copilot将全面降临Windows 11操作系统。Windows Copilot简言之就是Bing AI聊天的Windows桌面版，基于GPT-4打造，它可以帮助用户自动化各种任务，包括复制粘贴、截图、管理多窗口等。根据计划，Windows Copilot将在6月份开始预览，Windows Insider会员将能率先体验。
微软还将在Microsoft Store中推出AI Hub，一站式介绍AI相关的应用程序及先进体验。

百度失去中国第一大桌面搜索引擎宝座，微软必应上位。在中国内地桌面搜索市场上，到2023年4月，微软必应的份额再次创出历史新高，达到了37.4%，取代百度成为中国第一大桌面搜索引擎；百度的份额降至27.01%；第三名到第六名的搜索引擎分别是搜狗、Yandex(俄罗斯)、好搜(360搜索)、谷歌，它们的市场份额分别为16.36%、7.45%、6.25%、5.2%。

4、英特尔发布万亿参数 AI 大模型“Aurora genAI”，比 ChatGPT 大近 6 倍

英特尔公布 1 万亿参数 AI 模型，比 ChatGPT 大 570%。英特尔是最新参与进来的玩家，并在近日公布了一个名为 Aurora genAI 的产品，它是一个主要用于科学领域的生成式 AI 模型。英特尔 Aurora genAI 模型以 Megatron 和 DeepSpeed 为基础，其规模达到了 1 万亿个参数（1 Trillion Parameters），相比之下 ChatGPT 的规模仅为 1750 亿参数，Aurora genAI 在参数规模上增长了约 570%。Aurora genAI 模型将在通用文本、科学文本、科学数据和与该领域相关的代码上进行训练。这将是一个纯粹以科学为重点的生成式 AI 模型，其潜在的应用范围是：

推动清洁能源聚变研究
催化剂研究
癌症研究
航空航天研究
神经科学研究
宇宙学研究

据英特尔透露，他们使用的是名为 Aurora（欧若拉）的超级计算机，这是英特尔与阿贡国家实验室和 HPE 合作开发的百万兆级超级计算机。Aurora 超级计算机采用了 21248 个 Sapphire Rapids 至强 CPU、63744 个 Xe 架构的 Ponte Vecchio GPU（英特尔表示 Ponte Vecchio GPU 的性能要优于英伟达的 H100）。Aurora 超级计算机还使用了 1024 个 DAOS 节点和 10.9 PB 的 DDR5 傲腾持久内存，所有这些组件通过 oneAPI 互相链接，实现了百万兆级性能。

点评：太费计算资源了，一般企业没法玩。

5、华盛顿大学开源了“原驼（Guanaco）”大模型，自动测试分数达到ChatGPT的99.3%

开源大模型又取得了重要成果，华盛顿大学的“原驼”自动测试分数达到ChatGPT的99.3%,人类难以分辨两者的回答。英伟达科学家Jim Fan博士对此评价为: 这是大模型小型化的又一里程碑。先扩大规模再缩小，将成为开源AI社区的节奏。更关键的是，与原驼一起提出的新方法QLoRA把微调大模型的显存需求从>780GB降低到<48GB。开源社区直接开始狂欢，相关论文成为24小时内关注度最高的AI论文。GPT-4做裁判，原驼得分达到ChatGPT的99.3%。

6、医联发布国内首款医疗大语言模型 MedGPT

医联正式发布其自主研发的基于Transformer架构的国内首款医疗大语言模型——MedGPT。与通用型的大语言模型产品不同，MedGPT主要致力于在真实医疗场景中发挥实际诊疗价值，实现从疾病预防、诊断、治疗到康复的全流程智能化诊疗能力。

谷歌于5月11日推出PaLM2语言大模型，其中针对医疗AI领域的Med-PaLM2在USMLE问题测试中的准确率为85.4%，达到医疗专家的水平；生成式AI平台Hippocratic AI能够模拟不同类型的病人与医生进行对话，在114项证书和考试测试中，其中105项均超出GPT-4。在国内企业中，卫宁健康也推出大语言模型WiNGPT，共包含7大类基础任务与20多项子任务，在与ChatGPT问诊对比中，WiNGPT更为专业、准确、简练地生成主诉、现病史、诊断和建议。

7、TikTok正测试AI聊天机器人Tako

TikTok 正测试一款 AI 聊天机器人“Tako”，该工具可与用户交流短视频相关的问题，并帮助他们发现内容。

8、武汉大学推出大模型CheeseChat

武汉大学推出大模型CheeseChat，提供日常咨询，学业帮助。目前仅面向校内师生开启内侧。