引入

除了动态图转静态图的方式导出推理模型之外
Paddle2.0中也正式内置了ONNX模型的导出功能
本文将通过一个实例演示一下如何将Paddle模型导出为ONNX模型
并在ONNXRunTime上完成模型的推理预测

ONNX

Open Neural Network Exchange (ONNX) ，是一个机器学习模型的开放标准，方便不同框架之间进行模型交换
你可以在很多支持ONNX模型导出的框架上构建模型，然后导出ONNX模型进行预测部署

Paddle2ONNX

目前Paddle导出ONNX模型需要安装Paddle2ONNX进行额外支持
Paddle2ONNX支持将PaddlePaddle模型格式转化到ONNX模型格式。
- 模型格式，支持Paddle静态图和动态图模型转为ONNX，可转换由save_inference_model导出的静态图模型。动态图转换目前处于实验状态，将伴随Paddle 2.0正式版发布后，提供详细使用教程
- 算子支持，目前稳定支持导出ONNX Opset 9~11，部分Paddle算子支持更低的ONNX Opset转换，详情可参考算子列表
- 模型类型，官方测试可转换的模型请参考模型库
更多详情请参考Paddle2ONNX的Github主页

# PIP 安装
$ pip install paddle2onnx

# 源码安装
$ git clone https://github.com/paddlepaddle/paddle2onnx
$ cd paddle2onnx 
$ python setup.py install

动态图ONNX模型导出

如果使用Paddle2.0构建的动态图模型，可以通过调用paddle.onnx.export()来实现ONNX模型的快速导出
大致的原理就是动转静在将静态图模型转换为ONNX模型，所以转换的代码上与动转静很相似
接下来就通过代码来演示一下导出的流程

import os
import time
import paddle

# 从模型代码中导入模型
from u2net import U2NETP

# 实例化模型
model = U2NETP()

# 加载预训练模型参数
model.set_dict(paddle.load([path to the pretrained model]))

# 将模型设置为评估状态
model.eval()

# 定义输入数据
input_spec = paddle.static.InputSpec(shape=[None, 3, 320, 320], dtype='float32', name='image')

# ONNX模型导出
paddle.onnx.export(model, [path to the save onnx model], input_spec=[input_spec], opset_version=[opset version])

2021-01-09 17:12:24 [INFO]	ONNX model saved in u2netp.onnx

静态图模型转换

除了动态图模型可以导出为ONNX模型
静态图的推理模型当然也可以转换为ONNX模型
通过命令行调用如下命令即可完成转换
更多细节请参考paddle2onnx官方Github文档

$ paddle2onnx \
    --model_dir [model dir] \
    --model_filename [model filename] \
    --params_filename [params filename] \
    --save_file [save file] \
    --opset_version [opset version]

2021-01-09 17:12:28 [INFO]	ONNX model saved in u2netp_static.onnx

模型可视化

通过VisualDL工具可以轻松的进行模型结构的可视化查看
选择刚才保存后缀为.onnx的模型文件
具体的可视化图像就像下图所示的那样：

模型测试

这里使用ONNXRunTime来进行ONNX模型验证测试

# 安装ONNXRunTime
$ pip install onnxruntime

import time
import numpy as np
from onnxruntime import InferenceSession

# 加载ONNX模型
model = InferenceSession([path to the save onnx model])

# 准备输入
x = np.random.random((1, 3, 320, 320)).astype('float32')

# 模型预测
d0, _, _, _, _, _, _ = model.run(output_names=None, input_feed={
    
    'image': x})

# 打印输出形状
print(d0.shape)

# 速度测试
start = time.time()
d0, _, _, _, _, _, _ = model.run(output_names=None, input_feed={
    
    'image': x})
end = time.time()
print('predict time: %.04f s' % (end - start))

(1, 1, 320, 320)
predict time: 0.7178 s

部署实例

接下来通过加入数据预处理和后处理来完成完整的模型推理部署

import cv2
import time
import numpy as np
import matplotlib.pyplot as plt

from onnxruntime import InferenceSession
from processor import preprocess, postprocess

# 输入输出设置
img_path = [path to the input image]
output_dir = [output dir]

# 数据预处理
img = preprocess(img_path)

# 加载模型
model = InferenceSession([path to the save onnx model])

# 模型推理
start = time.time()
d0, _, _, _, _, _, _ = model.run(output_names=None, input_feed={
    
    'image': img})
end = time.time()
print('predict time: %.04f s' % (end - start))

# 结果后处理
mask_path, result_path = postprocess(d0, img_path, output_dir)

# 图像显示
img = np.concatenate([
    cv2.imread(img_path),
    cv2.imread(mask_path),
    cv2.imread(result_path)
], 1)
plt.axis('off')
plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
plt.show()

predict time: 0.7305 s

在这里插入图片描述

总结

Paddle2.0目前内置了导出ONNX模型的接口，可以较为方便的导出ONNX模型
对于之前的静态图模型，使用Paddle2ONNX工具也可以进行转换
使用ONNX模型进行推理部署也比较简单和方便
但目前仍有一些Paddle算子存在兼容性问题，导致一些模型无法正常的进行导出操作
总体体验还是不错的，也希望这个功能未来能够更加完善，支持更多算子

Paddle2.0：ONNX模型的导出和部署

引入

ONNX

Paddle2ONNX

动态图ONNX模型导出

静态图模型转换

模型可视化

模型测试

部署实例

总结

猜你喜欢