让生成式AI“无处不在”，英特尔软硬齐下

今年以来，以ChatGPT等生成式AI工具席卷全球，在背后所需的计算使性能、成本和能效成为大家关注的焦点。如何将生成式AI普适化，让各行各业都可以使用？

近日，在英特尔生成式AI技术与行业发展媒体沟通会上，英特尔院士、大数据技术全球首席技术官戴金权先生为我们详细解析英特尔的洞察与思考。

01 让生成式AI“无处不在”

戴金权表示，英特尔一直致力推动“AI无处不在”的美好愿景，因此也希望推动生成式AI的“无所不在”。

具体来说，英特尔希望通过对算力优化、计算能力的提升来支撑生成式AI无所不在。

首先，在专业AI硬件加速上，不管是GPU，还是专用AI加速器如Gaudi 2，最新发布的第四代至强可扩展服务器加入专门针对矩阵运算的加速器（英特尔® AMX），以满足生成式AI对性能、价格和可持续性的需求。

在软件上，英特尔利用软件将硬件的计算能力释放，通过和 PyTorch、TensorFlow、Hybrid Bonding 等的合作，还有在 OpenAI 的 AI编译器 Triton上做的工作，以及和微软做大规模分布式训练的软件栈DeepSpeed上做了大量的优化。

英特尔致力拥抱开源，通过开源软件工具oneAPI在XPU的架构下，为客户的笔记本、数据中心处理器、加速器，做到针对不同场景下对生成式AI的支持。

英特尔关注开放大语言模型，例如和Hugging face等开源模型做了很多工作。通过和Hugging face合作，利用Gaudi 2加速器，对BLOOMZ 176B进行了优化和评估，这可能迄今为止最大的一个开源语言模型。其效果显示，如果用8张Gaudi 2运行推理，与8张英伟达A100相比， Gaudi 2要比A100的快20%以上。此外，英特尔和Hugging face在Stable Diffusion上也展开一些合作，在最新的第四代英特尔至强可扩展处理器上，利用AMX高级矩阵扩展来进行矩阵加速，可以做到在5分钟内微调一个属于自己的Stable Diffusion模型，四五秒进行推理。

通过以上举措，英特尔通过提供全方位的“智能计算”能力来支持生成式AI应用。“英特尔的目标是希望将生成式AI普适化，让AI无所不在，只有每一颗英特尔芯片都可以提供智能计算能力来支撑生成式AI，我们才真正做到AI无所不在。” 戴金权表示。

众所周知，英特尔拥有强大的计算能力，这可以从笔记本电脑上的CPU、集成显卡、独立显卡，数据中心的至强服务器中充分感受到。

02 普通笔记本也能跑大模型，英特尔做到了

会上戴金权展示一段视频，将大语言模型运行在个人笔记本上。7B（70亿参数）入门级大语言模型目前在笔记本上的运行速度有了很高的提升，13B（130亿参数）大语言模型基本上可以跟上人的阅读速度，与人进行交互。65B（650亿参数）大语言模型也能运行在至强处理器上。

除了大语言模型外，Stable Diffusion可运行在12代酷睿笔记本上，不需要任何独立显卡，直接利用集成显卡，可以在二、三十秒的时间里生成一张图片，用户体验非常好。戴金权表示，如果说用户拥有英特尔Arc独立显卡，就可以在三、四秒之内将这张图片生成出来。

说完后，戴金权演示了用一台在笔记本运行Stable Diffusion，让它生成一张中国画风格的猫，仅用 20 多秒就实现了。“用户可以在任何一台普普通通的英特尔笔记本，哪怕是一台轻薄本上实现，真正体现了‘生成式AI无处不在’”。

除了上述消费级用户可以方便体验生成式AI技术外，谈到生成式AI的巨大机遇，戴金权表示，生成式AI有助于提高生产力，以Stable Diffusion为例，可以帮助设计师通过简单的草图和描述生成最终的效果图和渲染图，这将极大提高他们的工作效率。在2023英特尔On产业创新峰会上，英特尔和时尚行业3D设计软件服务提供商浙江凌迪数字科技有限公司（Style3D）合作，帮助他们构建生成式AI和3D结合的设计应用，可以通过笔记本部署到他们客户的客户端。

另外，在 AI for Science 等领域也有良好的发展前景和展望，如何将AI大模型应用到科学领域意义重大。目前，英特尔推出生成式 AI大模型Aurora genAI，这是一款参数高达一万亿的生成式 AI 模型，主要面向科研领域，包括生物学、医学、大气科学、化学、天文学等科研领域。

03 负责任的AI

自生成式AI诞生以来，安全和隐私保护问题不容忽视，受到业界关注。戴金权介绍英特尔主要从以下三个方面来开展“负责任的AI”工作：

第一，英特尔内部涉及AI 的数据、模型、应用等，都有一个“负责任的AI”的流程，其中定义了如何消除偏见、如何使用正确的数据等。

第二，英特尔在数据安全和隐私计算方面做了很多相关工作，打造硬件级的安全技术如英特尔TDX、英特尔SGX，和软件层构建的面向大数据分析和机器学习的隐私计算平台，再结合大语言模型和Stable diffusion，从数据和模型两方面来保护生成式AI的应用，确保数据安全和隐私性。

第三，生成式AI有一些内容是机器生成出来的，对此，英特尔研究院也做了很多工作，实现通过算法来判定生成出来的内容是否是Deepfake等应用生成的。

除此之外，通过在笔记本上运行 Stable Diffusion等大语言模型，不仅降低了AI的使用门槛，让消费者均可使用生成式AI，还大大保护了数据模型的隐私，因为可以将生成式AI、大语言模型部署在本地，算法、应用、数据都在本地，而无需与其他人分享。

让生成式AI“无处不在”，英特尔软硬齐下

猜你喜欢