re:Invent 2023 生成式 AI 的三个层级如何解锁无限创造力与生产力

人类、数据和 AI 之间的紧密且牢固的关系图谱，正在我们面前徐徐展开，受数据和 AI 的有力推动，生成式 AI正在成为推动千行百业应用创新的动力之源和科技领域的发展重心。
在这里插入图片描述

亚马逊云科技在今年的 re: Invent 2023 会议上突显了该技术如何成为这家云巨头议程的首要任务。在今天的主题演讲中，亚马逊云科技首席执行官 Adam Selipsky 表示：“围绕生成式 AI 模型的创新具有爆炸性。”他补充说：“它将重塑我们在工作和家庭中交互的每一个应用程序。我们正在以一种跟以往完全不同的方式来探讨生成式 AI 的整个概念。
在这里插入图片描述

亚马逊云科技在不断重构全栈生成式 AI三个层级：最底层是训练和推理的基础设施层，中间层是所有的微调模型需求的工具服务，上层是构建生成式 AI 应用层。

一、基础设施层—算力芯片与存储更新

亚马逊云科技在会上正式推出了为生成式 AI 和机器学习训练设计的云端 AI 芯片 Amazon Trainium2，基于训练芯片 Trainium 的成功经验， Amazon Trainium2针对万亿参数的基础模型（FM）和大语言模型（LLM）设计，将用在 Amazon EC2 Trn2 实例当中，单个实例包含 16 个 Trainium 芯片。，同时在 Amazon EC2 UltraCluster 产品中可扩展到多达 10 万个芯片。亚马逊表示，用由 10 万个 Trainium 芯片组成的集群来训练 3000 亿个参数的 AI 大模型，可将训练时间从数月缩短为仅几个星期。

在这里插入图片描述

亚马逊云科技有超过5年的自研芯片经验。Amazon Trainium 和 Amazon Inferentia 芯片可提供在云上训练模型和运行推理的超高性价比。基于 Inferentia2 的 Amazon EC2 Inf2 实例旨在以最低的成本在 Amazon EC2 中为客户的深度推理和生成式 AI 应用程序提供高性能。与 Inferentia 相比，Inferentia2 的吞吐提高了4倍，延低前者的1/10。

除此之外，会上还发布了第四代自研服务器 CPU 芯片 Amazon Graviton4。Selipsky 称，与在 Amazon EC2 上运行的上一代 Graviton 处理器 Graviton3（但不是更新的 Graviton3E ）相比，Graviton4 的处理速度提高了 30%，内核增加了 50%，内存带宽增加了 75%。Selipsky 还强调，“我们现在已经在短短五年内推出了第四代芯片。其他云提供商甚至还没有交付他们的第一个服务器处理器。”

在这里插入图片描述

除了算力芯片，亚马逊云科技还宣布了其 S3 对象存储服务推出重大更新：一种新的高性能、低延迟层 S3 存储类别 Amazon S3 Express One Zone，旨在为延迟敏感的应用提供个位数、毫秒级的每秒数十万次数据访问。Amazon S3 Express One Zone 的数据访问速度比 Amazon S3 标准版快 10 倍，请求成本降低 50%，计算成本降低 60%。

在这里插入图片描述

二、工具层——服务托管Amazon Bedrock

“不会有一种模式能够统治一切，”在今天的大会上，Adam Selipsky说。“你需要尝试不同的模型，你需要选择合适的模型提供商。我认为过去 10 天发生的事件已经非常清楚地表明了这一点。”

在这一层上，Selipsky重点介绍了全托管式生成式 AI 服务 Amazon Bedrock。Amazon Bedrock 是一项完全托管的服务，提供了来自众多领先 AI 公司（包括 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和亚马逊）面向海外业务的的高性能基础模型，客户无需管理任何基础设施，即可通过 Amazon Bedrock 在安全的环境中利用简单的 API 接口访问 Meta Llama2、Anthropic Claude、Titan、Stability AI、AI21 Labs、Cohere 等领先的基础模型，以构建和扩展其生成式 AI 应用程序。今年以来，Amazon Bedrock还重磅升级，增加了 Fine-tuning、Agents、Knowledge Bases、Guardrails等全新功能，帮助客户更高效、智能、安全地构建应用！

在这里插入图片描述

Amazon Bedrock 在两个月前推出，已经吸引了超过 10,000 名来自各个行业的活跃客户使用它来快速构建和扩展生成式 AI 应用，在实现简化开发的同时确保隐私性和安全性，极大地降低了客户从基础模型到构建生成式 AI 应用的门槛，借助全新 GA 的 Agents for Amazon Bedrock，用户可以通过简单的几个步骤创建和部署完全托管式的 Agent，通过动态调用 API 来执行复杂的业务任务。

在这里插入图片描述

三、应用层——AI助手Amazon Q

Adam Selipsky 在演讲中表示，“你可以使用 Amazon Q 轻松进行对话、内容生成并执行操作。Amazon Q 完全了解你的系统、数据存储库和运营需求。”
在这里插入图片描述
在本次的主题演讲中，亚马逊云科技还重磅推出了Amazon Q 预览版。Amazon Q 能够回答诸如“怎样使用亚马逊云科技构建 Web 应用程序？”之类的问题。经过亚马逊过去 17 年积累下的知识进行训练，Amazon Q 能够解答各种问题并提供相应的原因解释。用户可以将 Amazon Q 接入组织指定的应用程序和软件（例如 Salesforce、Jira、Zendesk、Gmail 以及 Amazon S3 存储实例等），并据此进行自定义配置。Amazon Q 能够根据所有关联数据及内容进行索引，“学习”关于当前业务的方方面面，包括组织结构、核心概念和产品名称等。

不仅能够回答问题，Amazon Q 还能作为助手生成或总结博文内容、新闻稿和电子邮件。它还为工作中的常规操作提供一组可配置的插件，包括自动创建服务工单、通过 Slack 中的特定团队以及更新 ServiceNow 中的仪表板等。为了防止错误，Amazon Q 要求用户在行动之前检查其操作建议，并展示结果以供验证。

Amazon Q 与 Amazon CodeWhisperer 服务相结合，可以生成并解释应用程序代码。在受支持的 IDE（例如亚马逊云科技的 CodeCatalyst）当中，Amazon Q 可以为客户代码生成测试，借此衡量其质量水平。Amazon Q 还能创建软件新功能、执行代码转换，并为代码包、存储库和框架更新草案和文档，使用自然语言对计划进行完善和执行。
在这里插入图片描述
作为亚马逊云科技出品的一款生成式人工智能编程工具，Amazon CodeWhisperer经过了数十亿行级别代码的训练和调参，可以根据注释和现有代码实时生成从代码片段到全函数的代码建议，还可以扫描难以发现的代码漏洞，检查潜在的安全问题。另外，CodeWhisperer 还被内置了 Amazon Cloud9 和 Amazon Lambda 控制台, 也可以在 JupyterLab、Amazon SageMaker Studio、以及 Amazon Glue Studio Code 中通过加入 CodeWhisperer extension 进行使用。

四、仰望星空，未来已来

就个人开发者角度而言，2023 亚马逊云科技 re:Invent展现了生成式AI的巨大潜力和创新空间生成式AI都能为我们提供前所未有的创造力和灵感，生成式AI技术的不断发展将为我们个人开发者带来更加丰富的工具和资源，推动极大的创新和应用发展，通过使用生成式AI模型，我们可以生成逼真的图像、独特的音乐作品以及令人惊叹的文本内容，让我们的想法变为现实。而亚马逊云科技在本次re: Invent 2023上发布的产品和新工具，为我们提供了更完整、更灵活的开发环境和技术堆栈。

即刻点击查看2023亚马逊云科技 re:Invent高光时刻，共同见证亚马逊云科技的一小步，云计算的一大步！

在这里插入图片描述

最后借用Adam Selipsky在 re:Invent 主题演讲的一句话作为结尾：我们不断重构，通过重构驱动技术创新，重塑用户服务体验。让我们再次出发去重构，去将想象力变为现实，去见证未来将会发生的一切。