使用Optimum-Intel OpenVINO™轻松文生图——几行代码加速Stable Diffusion

作者:武卓博士 英特尔AI布道师

随着AIGC模型越来越强大,并取得了更惊人的结果,任意运行AIGC模型, 比如Stable Diffusion,对于开发人员来说仍然面临一些挑战。首先,GPU的安装设置需要我们处理复杂的配置和兼容性问题,这可能既耗时又令人沮丧。此外,如果运行Stable Diffusion代码前需要经过复杂的软件安装和环境配置步骤,这也会带来额外的困难。因为开发者们经常被干净直观的API所吸引,这使我们能够轻松地与模型交互并简化我们的工作流程。最后,在没有复杂代码编写以及编译的情况下,如何快速完成硬件加速仍然是一个开发者们优先关心的事项,因为开发者们总是寻求高效而直接的解决方案来充分利用AIGC算法的潜力。

图1. 我们需要更改的代码行数以获得英特尔的硬件加速

 在这篇文章中,我们将探索使用Optimum Intel(OpenVINO)在Stable Diffusion V2.1上实现AI硬件加速的最快方法(使用最少的代码行和依赖项安装)。我们还将指导您完成在本地机器上运行Stable Diffusion的安装和使用过程,并通过OpenVINO 2023.0版本进行优化和加速。只需几行Python代码,您就可以在几秒钟内生成带有文本的图像。此外,OpenVINO简化了在不同硬件平台(包括Intel Desktop CPU、iGPU、dGPU和Xeon CPU)上加速工作的过程,使您的工作在部署时更加灵活。有关该方法的更多详细信息,请点击此处查看我们在GitHub上的OpenVINO Notebook代码示例。

1.安装

使用如下一行代码安装Optimum-Intel[OpenVINO]:

pip install -q "optimum-intel[openvino,diffusers]"@git+https://github.com/huggingface/optimum-intel.git

2.下载预转换过的Stable Diffusion 2.1 IR模型

Stable Diffusion将6个元素结合在一起,一个带有标记器的文本编码器模型,一个带调度器的UNet模型,以及一个带有解码器和编码器模型的自动编码器。

这里使用的基础模型是"stabilityai/stable-diffusion-2-1-base"。该模型被转换为OpenVINO格式,用于使用Optimum Intel[OpenVINO]在CPU或Intel GPU上加速推理。模型权重以FP16精度存储,这将模型的大小减少了一半。你可以发现这个Notebook中使用的模型名称是"helenai/stabilityai-stable-diffusion-2-1-base-ov"。让我们下载带有以下代码的预转换模型Srable Diffusion 2.1Intermediate Representation Format (IR)  

from optimum.intel.openvino import OVStableDiffusionPipeline
# download the pre-converted SD v2.1 model from Helena's HF repo
name = "helenai/stabilityai-stable-diffusion-2-1-base-ov"

pipe = OVStableDiffusionPipeline.from_pretrained(name, compile=False)
pipe.reshape(batch_size=1, height=512, width=512, num_images_per_prompt=1)

 3. 保存预先训练好的模型,选择推理设备并编译

我们已经下载了预先训练和转换的IR格式Stable Diffusion模型。让我们保存模型,并使用以下代码编译它进行AI推理.

pipe.save_pretrained("./openvino_ir")
pipe.to("GPU.1")
pipe.compile()

4. 发挥你的创意,输入文本,享受生成的美图吧

现在是时候发挥创意了!输入创意提示,并使用以下内容欣赏生成的图像

# Generate an image. 
prompt = "red car in snowy forest, epic vista, beautiful landscape, 4k, 8k"
output = pipe(prompt, num_inference_steps=17, output_type="pil").images[0]
output.save("image.png")
output

以下动图展示了图片生成的各步骤的效果。

更多的资源信息:

OpenVINO™ 2023.0 新版本介绍(麻烦附上新版本介绍链接)

OpenVINO™ Notebooks

在英特尔DevCloud for the Edge 运行

欢迎在这里反馈结果以及开启讨论

致谢

感谢Helena Kloosterman 提供宝贵的指导意见。

猜你喜欢

转载自blog.csdn.net/gc5r8w07u/article/details/131783304
今日推荐