利用生成式 AI 实现技术创新突破

关键字: [Amazon Web Services re:Invent 2023, Amazon Bedrock, Generative Ai, Enterprise Scale, Choice Of Models, Responsible Ai, Machine Learning Infrastructure]

本文字数: 1700, 阅读完需: 8 分钟

视频

如视频不能正常播放,请前往bilibili观看本视频。>> re:Invent 2023 | 借助生成式 AI 加速创新_哔哩哔哩_bilibili

导读

随着生成式 AI 的出现,机器学习(ML)的广泛采用正处于转折点。与亚马逊云科技人工智能和机器学习服务副总裁 Bratin Saha 博士一道,聆听各个行业的客户如何利用人工智能和机器学习(包括生成式 AI)的最新突破,助他们转型业务。探索最新的亚马逊云科技创新,听取头部客户的意见,探索人工智能/机器学习的发展方向。

演讲精华

以下是小编为您整理的本次演讲的精华,共1400字,阅读时间大约是7分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

视频开始展示了一个场景,展示了生成式AI如何在实际工作场所以外的任务中发挥作用。在这个场景中,Kimberly正在与Bratin讨论如何为即将到来的演讲准备幻灯片。他们建议采用Amazon Bedrock(亚马逊云科技的一款生成式AI服务),只需输入文本提示即可自动生成演讲幻灯片。这表明了生成式AI可以简化业务工作流程,例如创建演示文稿等。

接下来,亚马逊云科技的副总裁Bratin Saha在re:Invent上发表了主题演讲。他回顾了过去5年里机器学习创新的巨大加速,这得益于丰富的计算能力、数据和来自云端的模型。Bratin透露,过去6年里,用于训练机器学习的计算量增长了超过10万倍,用于训练机器学习模型的数据量增加了超过100倍,而模型本身的大小扩大了超过1000倍。他强调,这是信息技术史上前所未有的进步速度。

从Bratin的观点来看,最近的几乎所有主要机器学习进步都源于云端。云端提供了核心基础设施,使这一快速创新成为可能,并通过向实践者提供大量的计算和数据。

然后,Bratin转向讨论特定的生成式AI。他解释了像基础模型这样的模型是如何通过在包含万亿词汇的互联网规模数据上训练来实现其令人印象深刻的功能的。为了说明用来训练这些模型的大量数据的规模,他指出,这些模型摄入的文本量比一个人在其一生中处理的文本量还要多几千倍。这些模型吸收了数百万GB的数据,超过了Wikipedia所包含的信息的数量级。通过吸收这么多数据,这些模型具备了远超人类或早期AI的能力。

然而,Bratin强调,用这些强大的基础模型构建有影响力的应用需要解决新的挑战。组织必须回答的关键问题是如何将这些模型有效地投入使用。Bratin随后详细讲述了亚马逊在构建Amazon Q(其自然语言生成式AI服务)时所经历的过程,以说明在实际构建生成式AI应用时涉及的现实考虑。

亚马逊在创立Q时所面临的第一个决策是选择哪种基础模型。据Bratin介绍,在测试了多种不同模型并对其优缺点进行了深入分析后发现,没有一个模型是普遍最优的。有些模型使用较少的词汇提供较短、更简洁的回答,而其他模型则给出更详细的但冗长的输出。最合适的模型取决于应用的具体目标和用例。经过评估,亚马逊最终决定为Q选择一个以成本效益为优势的基础模型,并根据他们的需求进行定制和优化。

Bratin强调,对于Q而言,采用单一的大型模型方法并未被证明是最有效的。相反,亚马逊实施了一种使用许多不同专门化模型来处理特定任务的架构,这类似于人类大脑的异构结构。例如,用于执行任务如理解意图、检索知识、制定回应等组件的分离模型使得Q能够充分理解和回答自然语言查询。

在构建Q的过程中,优化数据工程也被证明是至关重要的。Bratin解释道,Q需要从企业内部的各种来源汇总信息以有帮助地回答查询。这需要数据连接器从数据库、客户关系管理系统、文档等中收集相关数据来回答问题。大量的工作投入到了构建企业数据连接器、预处理数据、实施数据质量检查和后处理,以便Q能够快速准确地获取正确的信息。

此外,Bratin指出,严格的访问控制和问责AI功能对于确保Q只向授权用户提供机密答案至关重要。例如,Q不应该向工程师揭示敏感财务数据,而高管可以查看。系统必须尊重组织的数据访问策略。因此,亚马逊为此投入了大量的努力到访问管理、敏感主题标签和其他责任AI技术。

Bratin总结创建Q的关键经验教训,作为开发企业规模的生成式AI应用程序的五个主要考虑因素:

  1. 在模型选择方面,具有灵活性和多样性。并非所有应用场景都存在通用的最佳基础模型。开发者需要尝试不同的模型,并根据特定需求进行定制。

  2. 通过数据实现差异化。高质量、受控且针对业务定制的数据对于驱动生成式AI并提供相关背景至关重要。

  3. 整合负责任的人工智能。准确性、安全性和公平性的保障必须嵌入到模型和应用中。

  4. 经济又高性能的基础设施。训练和推断生成式AI需要大量的计算资源。

  5. 生成式AI应用。专为特定业务工作流程设计的解决方案可以带来显著的价值。

Bratin表示,亚马逊云科技提供了一系列服务,以帮助客户在构建生成式AI应用时解决这些关键问题。例如,Amazon Bedrock 提供了访问用于开发自定义解决方案的前沿基础模型的途径。SageMaker 帮助无缝地管理、训练和部署模型。SageMaker Clarify 允许评估模型的公平性、安全性和准确性。此外,如 Q 等服务还为常见场景提供了即用的生成式AI应用。

视频中还强调了几个客户如何利用亚马逊云科技创新使用生成式AI的例子:

Ryan Air的首席技术官John Hurley解释了他是如何使用Amazon Bedrock来创建名为Ryan的员工聊天机器人,该机器人可以回答政策和程序问题。这有助于机组人员在旅途中更有效地访问重要的工作信息。Ryan Air每天运营超过3,300个航班,在欧洲运送60万乘客。Bedrock的生成能力使Ryan Air能够为其庞大的员工群体提供更好的体验。

Fidelity Investments的AI创新主管Vipin Mayar强调了多年来对非结构化数据进行有意识地收集、组织和提供访问的重要性。Fidelity已经数字化了56年以来的通话和文本。这种对对话的历史聚合现在证明是非常有价值的,因为它提供了微调亚马逊云科技Bedrock等大型语言模型时所需的特定金融服务业务的上下文数据。

Arvind Jain,Glean公司的首席执行官,展示了他们最新的企业搜索助手服务如何通过Bedrock模型来为员工提供经过验证的答案,这得益于在公司知识库中的深入搜索。为了确保数据的安全性,Glean会对数据进行索引,并通过应用诸如内嵌引用之类的后期处理技术来优化准确性。这样一来,员工就能更高效地利用机构的资源。

Dr. Ebtesam Almazrouei,技术创新研究所的首席人工智能研究员,解释了他们是如何利用亚马逊云科技的服务,如SageMaker和数千个GPU,来训练全球最大的开源模型——拥有1800亿参数的Falcon自然语言模型的。这种巨大的计算规模对于评估如此庞大的先进生成模型至关重要。

最后,Tom Herzog,Netsmart公司的首席运营官,分享了他们在远程医疗应用程序中计划如何使用Amazon HealthScribe的想法,这样可以让医疗保健提供者有更多的时间照顾病人。HealthScribe利用生成式AI自动从患者互动中创建临床笔记,从而减少了对手动记录的需求。这将有助于缓解精神健康专业人士的短缺问题,因为他们目前40%的时间都用于撰写文档,而留给病人的时间则相对较少。

总的来说,这段视频展示了亚马逊云科技如何提供端到端的服务,以帮助企业构建具有影响力的、负责任的生成式AI应用程序,从亚马逊Bedrock的基础模型到定制的解决方案,如HealthScribe。成功的关键因素包括为特定用例选择正确的模型,监管和准备高质量的数据,保护安全和确保公平,利用可扩展的基础设施,以及采用即用的应用程序。通过这些合适的方法,生成式AI在各个行业中都有可能带来巨大的创新,正如各种客户案例所展示的那样。亚马逊云科技致力于帮助组织成功地应对这些挑战,以创建真正具有商业价值的生成式AI应用程序。

下面是一些演讲现场的精彩瞬间:

领导者向观众们询问了他们最近的状况。

如今,无需编程的Amazon SageMaker Canvas界面支持基础模型,使得非专业开发者也能够轻松地构建、定制、训练和调整模型,无需具备编程技能。

在医疗保健领域,人们致力于帮助他人,我们需要运用技术来提高护理人员的效率,以便他们能更好地为患者提供服务。

领导者指出,由于需求远大于供应,医疗保健服务的预约选择受到了限制。

领导者强调了解决方案的高度易用性的重要性,以便减轻医护人员的负担,并帮助他们为患者提供更优质的结果。

通过与亚马逊云科技建立合作关系,合作伙伴们共同推动了突破性的医疗保健合作和创新。

总结

亚马逊云科技近期举办了一场由Dr. Bratin Saha主讲的活动,主题是关于如何更快速地利用生成式AI进行创新。他在演讲中强调了在企业构建和扩展生成式AI应用时的关键考虑因素。首先,Bratin谈论了拥有模型选择和灵活性的重要性。他指出,亚马逊云科技能够提供对各种最先进的基础模型的访问,这些模型可以根据特定使用情况进行调整。随后,来自Ryan Air的John Hurley详细分享了他们如何使用亚马逊云科技中的不同模型来构建员工聊天机器人。接着,Bratin强调了使用自己的数据进行区分的重要性。他宣布了一项新举措——PyTorch的S3 Connector,旨在加速基础模型的训练。来自Fidelity Investments的Vipin Mayar强调,他们在未来7年内将专注于建立一个强大的数据平台和分类体系,以支持AI创新。之后,Bratin谈到了责任AI的运用,并宣布了用于评估基础模型的SageMaker Clarify工具。Glean的Arvind Jain分享了他们如何确保准确性,指导模型选择以及保护客户数据的方法。最后,Bratin提到了机器学习基础设施的优化,以减少大型语言模型的成本和延迟。Technology Innovation Institute的Dr. Ebtesam Almazrouei介绍了他们是如何使用亚马逊云科技来创建Falcon(最大的阿拉伯语NLP模型之一)的过程。最后,Bratin强调了亚马逊云科技新推出的生成式AI应用——HealthScribe的,用于临床文档记录。Netsmart的Tom Herzog解释了这个系统如何能够帮助医生有更多时间去看更多的病人。总的来说,Bratin提出了一系列关键考虑因素和亚马逊云科技推出的新功能,以帮助企业能够在构建有影响力的、负责任的生成式AI应用方面取得进步。

演讲原文

Innovate faster with generative AI-CSDN博客

想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!

点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!

即刻注册亚马逊云科技账户,开启云端之旅!

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁?

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。

猜你喜欢

转载自blog.csdn.net/weixin_46812959/article/details/134717494
今日推荐