TPU-MLIR实战——ResNet18部署

1.编译ONNX模型

本章以 resnet18.onnx 为例, 介绍如何编译迁移一个onnx模型至BM1684X TPU平台运行。

该模型来自onnx的官网:

models/vision/classification/resnet/model/resnet18-v1-7.onnx at main · onnx/models · GitHub

本例模型和代码在 http://219.142.246.77:65000//sharing/hddTi2adl

下载到本地 model_resnet18.tar.gz，并解压：

  tar zxvf resnet18_classify.tar.gz

model_resnet18目录中包含以下文件：

model/resnet18.onnx resnet18原始模型
images/ 测试图片集
ILSVRC2012/ 量化用数据集
outputs 输出结果位置
Workspace 编译量化结果存放位置
calssify_resnet18.py 推理程序

2.加载TPU-MLIR

以下操作需要在Docker容器中。关于Docker的使用, 请参考启动Docker Container

$ tar zxf tpu-mlir_xxxx.tar.gz
$ source tpu-mlir_xxxx/envsetup.sh

envsetup.sh 对环境变量的修改内容为:

export PATH=${TPUC_ROOT}/bin:$PATH
export PATH=${TPUC_ROOT}/python/tools:$PATH
export PATH=${TPUC_ROOT}/python/utils:$PATH
export PATH=${TPUC_ROOT}/python/test:$PATH
export PATH=${TPUC_ROOT}/python/samples:$PATH
export LD_LIBRARY_PATH=$TPUC_ROOT/lib:$LD_LIBRARY_PATH
export PYTHONPATH=${TPUC_ROOT}/python:$PYTHONPATH
export MODEL_ZOO_PATH=${TPUC_ROOT}/../model-zoo

3 准备工作目录

建立 model_resnet18目录, 注意是与tpu-mlir同级目录; 并把模型文件和图片文件都放入 model_resnet18 目录中。操作如下:

$ mkdir model_resnet18 && cd model_resnet18
$ cp -rf $TPUC_ROOT/python/samples/classify_resnet18.py .
$ mkdir workspace && cd workspace
$ mkdir outputs

4 ONNX转MLIR

模型转换命令如下:

$ model_transform.py \    
	--model_name resnet18 \    
	--model_def ../model/resnet18.onnx \    
	--input_shapes [[1,3,224,224]] \    
	--mean 0.0,0.0,0.0 \    
	--scale 0.0039216,0.0039216,0.0039216 \    
	--keep_aspect_ratio \    
	--pixel_format rgb \    
	--output_names output \    
	--test_input ../images/dog.jpg \    
	--test_result resnet18_top_outputs.npz \	
	--mlir resnet18.mlir \

转成mlir文件后, 会生成一个 ${ model_name}_in_f32.npz 文件, 该文件是模型的输入文件。

model_transform.py参数表

参数名	必选？	说明
model_name	是	指定模型名称
model_def	是	指定模型定义文件, 比如`.onnx`或`.tflite`或`.prototxt`文件
input_shapes	否	指定输入的shape, 例如[[1,3,640,640]]; 二维数组, 可以支持多输入情况
resize_dims	否	原始图片需要resize之后的尺寸; 如果不指定, 则resize成模型的输入尺寸
keep_aspect_ratio	否	在Resize时是否保持长宽比, 默认为false; 设置时会对不足部分补0
mean	否	图像每个通道的均值, 默认为0.0,0.0,0.0
scale	否	图片每个通道的比值, 默认为1.0,1.0,1.0
pixel_format	否	图片类型, 可以是rgb、bgr、gray、rgbd四种情况
output_names	否	指定输出的名称, 如果不指定, 则用模型的输出; 指定后用该指定名称做输出
test_input	否	指定输入文件用于验证, 可以是图片或npy或npz; 可以不指定, 则不会正确性验证
test_result	否	指定验证后的输出文件
excepts	否	指定需要排除验证的网络层的名称, 多个用,隔开
mlir	是	指定输出的mlir文件名称和路径
post_handle_type	否	将后处理融合到模型中，指定后处理类型，比如yolo、 ssd

5 MLIR转F32模型

将mlir文件转换成f32的bmodel, 操作方法如下

$ model_deploy.py \    
	--mlir resnet18.mlir \   
	--quantize F32 \   
 	--chip bm1684x \    
	--test_input resnet18_in_f32.npz \    
	--test_reference resnet18_top_outputs.npz \    
	--tolerance 0.99,0.99 \   
 	--model resnet18_1684x_f32.bmodel

编译完成后, 会生成名为 ${ model_name}_1684x_f32.bmodel 的文件。

6 MLIR转INT8模型

6.1生成校准表

    run_calibration.py resnet18.mlir \

      --dataset ../ILSVRC2012 \

      --input_num 100 \

      -o resnet18_cali_table

6.2 编译为INT8对称量化模型

$ model_deploy.py \    
	--mlir resnet18.mlir \    
	--quantize INT8 \    
	--calibration_table resnet18_cali_table \    
	--chip bm1684x \    
	--test_input resnet18_in_f32.npz \    
	--test_reference resnet18_top_outputs.npz \   
	--tolerance 0.85,0.45 \    
	--model resnet18_1684x_int8_sym.bmodel

6.3转成INT8非对称量化模型

$ model_deploy.py \
    --mlir resnet18.mlir \
    --quantize INT8 \
    --asymmetric \
    --calibration_table resnet18_cali_table \
    --chip bm1684x \
    --test_input resnet18_in_f32.npz \
    --test_reference resnet18_top_outputs.npz \
    --tolerance 0.90,0.55 \
    --model resnet18_1684x_int8_asym.bmodel

7 测试

7.1 onnx模型测试

执行以下推理命令

$ ./classify_resnet18.py --model_def model/resnet18.onnx --input images/cat.jpg --output outputs/cat_onnx.jpg  --category_file images/label.txt

./calssify_resnet18.py 执行当前目录下的py文件

--model_def 模型参数，输入模型的位置，可以是onnx,bmodel

--input 输入图片

--output 输出路径

--category_file label的路径

7.2 Fp32模型测试

执行推理命令：

./classify_resnet18.py --model_def workspace/resnet18_1684x_f32.bmodel --input images/cat.jpg --output outputs/cat_f32.jpg  --category_file images/label.txt

7.3 INT8 对称模型测试

./classify_resnet18.py --model_def workspace/resnet18_1684x_int8_sym.bmodel --input images/cat.jpg --output outputs/cat_int8.jpg  --category_file images/label.txt

8 结果对比