2023 亚马逊云科技中国峰会技术解读:算力、数据、AI,全面支撑 AIGC 与云上创新

编辑 | 宋慧

出品 | CSDN 云计算

亚马逊云科技每年在中国的顶级会议——2023亚马逊云科技中国峰会已经圆满落幕,今年峰会聚焦在AIGC与全球化等方面的议题,而支撑这些产品与服务的,则是亚马逊云科技十多年以来所探索、创新、积累的技术实力。在峰会第二天,亚马逊云科技全球产品副总裁 Matt Wood与亚马逊云科技大中华区产品部总经理陈晓建详细介绍了亚马逊云科技针对AIGC,核心技术分析与自身产品服务经验,详细来说可以分为算力、AI、数据三方面内容,值得开发者重点了解。

自研芯片、高度可靠云基础架构,支撑 AIGC 算力需求

提供云基础设施和计算存储资源服务是亚马逊云科技的看家本领,经过 17 年的积累,峰会上亚马逊云科技详细列举了如何构建高度可靠的云基础架构的设计思路,共分为八个方面:

  1. 区域隔离,多可用区设计:每个区域都会有多个可用区,任何单一可用区的故障不会影响到其他可用区的业务,最大限度降低服务的中断。
  2. 控制面和数据面解耦:更多地依靠数据面来保持服务运行、降低对控制面的依赖,能够提高整体稳定性。
  3. 蜂窝架构:把系统分割成多个微小的、单一的、相互之间隔离的蜂窝状单元,能够在问题出现时降低爆炸半径,通过爆炸半径能够把故障控制在一个单元以内。
  4. 随机分片:是对蜂窝架构的进一步优化。它把客户的访问随机分配到不同的单元中,说单个单元的故障并不会对整个系统造成影响,还是可以通过其他的单元完成。
  5. 服务责任模型:通过明确定义亚马逊云科技与客户责任区间的方式,保障客户在应用的任何阶段都能享有对所写代码和程序的控制权。
  6. 运营就绪审查:通过对亚马逊云科技大量运营案例进行分析,对过往的问题进行复盘,从而用户在整个部署的时候能够避免重现他们之前所发生的问题。
  7. 安全的持续部署:可以最大限度减少因错误部署而对生产造成的影响。
  8. COE 纠错流程:了解问题所发生时候的系统状态,以防止类似的错误再次发生。

除了技术架构的设计思路,另一个重要的技术方向,也是各家云厂商重点攻关的,是自有芯片的研发。在支持 Intel、AMD、英伟达等主流芯片之外,亚马逊云科技近几年在自研芯片的投入和成果也非常突出。现在,亚马逊云科技已经推出了第五代 Nitro、Arm 架构的通用处理器 Graviton 3、机器学习训练芯片 Trainium、机器学习推理芯片 Inferentia,涵盖重要的算力需求和场景,而且在资源损耗、隔离干扰、极致性能和加密等各块技术都实现了突破。

AIGC 研发利器:大模型服务 Amazon Bedrock、自有模型库 Amazon Titan、免费的 AI 代码编程助手 Amazon CodeWhisperer

AIGC 是今年峰会的重要话题,也能看到亚马逊云科技对于 AIGC 的全面投入。除了上面提到的推理芯片 Inferentia 和训练芯片 Trainium,在第二天的技术主题演讲里,亚马逊云科技全球产品副总裁 Matt Wood 详细介绍了通用大模型之上,对于企业用户来说,解锁 AIGC 的价值需要做到的四个方面技术工作:首先要提供对一流基础模型的访问,第二需要提供安全私密的环境去定制模型,第三需要通过定制芯片提供低成本和低延迟访问;第四需要搜寻机会提升使用体验。

除了亚马逊云科技大名鼎鼎的机器学习方案 Amazon SageMaker 之外,今年峰会也重点提及了另外三个针对 AIGC 的产品与服务,分别是大模型服务 Amazon Bedrock、自有模型库 Amazon Titan、免费的 AI 代码编程助手 Amazon CodeWhisperer,提升 AI 研发效率,降低开发门槛。

首先是亚马逊云科技在今年 4 月所发布的 Amazon Bedrock,可以让开发者以 API 形式使用多种基础大模型如 AI21 Labs、Anthropic、Stability AI 和 Amazon 的 Titan 等,Amazon Bedrock 和亚马逊云科技数据湖和数据服务实现紧密集成,可将基础大模型和私有数据结合,进行定制化模型的开发,且无需大量的标注数据。另外,用户还可以使用 Amazon SageMaker JumpStart 搜寻和部署更多开源模型。

在接入基础大模型之后,开发者可以借助 Amazon Titan 模型库实现安全且私密的模型调优。Amazon Titan 是一系列不同的模型的库,可实现文本归纳总结、搜索结果嵌入、有害内容删减等,用户可以非常安全、隐私地对这些模型做优化和微调,最终实现自身行业和场景的模型定制开发。

另一个重要的服务,是面向个人开发者免费的 AI 代码助手 Amazon CodeWhisperer,Amazon CodeWhisperer 基于机器学习为开发人员提供的一个代码生成的服务,支持包括 Java、JavaScript 和 Python 等在内的 15 种不同的编程语言。Amazon CodeWhisperer 从数十亿行公开代码中学习之外,还基于亚马逊的代码训练,可以为 Amazon EC2、Amazon Lambda 和 Amazon S3 等云服务生成最准确、最快和最安全的代码。开发者使用 Amazon CodeWhisperer,完成任务的速度平均快 57%,成功率高 27%。

打造 AIGC 数据底座,推出 Zero-ETL 的云原生数据平台

除了基础算力和 AIGC 工具,亚马逊云科技近年另一个重点技术方向是打造完整的一站式云原生的数据平台,并且已经逐步显现了实力与优势。目前,亚马逊云科技已经推出 15 种云上托管数据库服务,为各类用户应用场景提供数据服务,其中分析服务已全面实现 Serverless 化,例如交互式查询服务 Amazon Athena、大数据处理服务 Amazon Managed Streaming for Apache Kafka (Amazon MSK)、实时分析服务 Amazon Kinesis、数据仓库服务 Amazon Redshift、数据集成服务 Amazon Glue、商业智能服务 Amazon QuickSight 以及运营分析服务 Amazon OpenSearch Service。

有了这么多数据产品的积累,峰会上,亚马逊云科技提出了重要的一项 Zero-ETL 的数据战略和愿景,致力于实现无缝的数据转换和调用,而用户不用编写任何的代码。这一愿景是基于一项亚马逊云科技推出的新服务:Amazon Aurora 与 Amazon Redshift 进行 Zero-ETL 集成,允许使用 Amazon Redshift 对来自 Aurora 的 PB 级事务数据进行近实时分析和机器学习 (ML)。事务数据在被写入 Aurora 后的几秒钟内,即可用在 Amazon Redshift 中,开发者不必构建和维护复杂的数据管道来执行提取、转换和加载 (ETL) 操作。

另外,亚马逊云科技希望构建端到端的数据治理,加速并保障数据流通。亚马逊云科技去年推出的一项全新的数据管理服务 Amazon DataZone,可以让用户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。借助 Amazon DataZone,管理员和数据资产管理者可以使用精细的控制工具管理和治理数据访问权限,确保数据访问发生在正确的权限和正确的情境之下。

总结

以算力、数据去支撑 AIGC 与云上创新,说起来简单,其实需要投入的技术与研发精力非常多。2023 亚马逊云科技中国峰会提到的所有技术与产品服务,最终都是希望为云上的开发者与用户提供“全方位、无死角”的服务与支持,这也是作为全球的云计算巨头所希望实现的目标,那就是,以亚马逊云科技所有的技术产品与服务,在全球 31 个区域的 99 个可用区(覆盖 245 个国家和地区),为用户的任何应用程序、任何运行场景、任何合规需求、任何弹性计算资源,提供稳固的支持与服务。CSDN 将持续报道亚马逊云科技重要的技术进展,也建议广大开发者重点关注。

猜你喜欢

转载自blog.csdn.net/FL63Zv9Zou86950w/article/details/131572705