TensorRT量化INT8模型报错记录及解决方案 - 代码天地

TensorRT量化INT8模型报错记录及解决方案

企业开发 2023-12-17 11:57:05 阅读次数: 0

基于C++将onnx 模型转 TensorRT 模型（int8）

部分命令如下：

config->setFlag(nvinfer1::BuilderFlag::kINT8);
ICudaEngine* engine = builder->buildEngineWithConfig(*network, *config);

出现以下报错：

Error Code 4: Internal Error (Calibration failure occurred with no scaling factors detected. This could be due to no int8 calibrator or insufficient custom scales for network layers. Please see int8 sample to setup calibration correctly.)

并且返回的engine为nullptr。

测试显卡：1080Ti

原因：

查看了网上其他人反应的情况，在1080Ti显卡上会出现该问题，但在2080Ti上正常。https://github.com/NVIDIA/retinanet-examples/issues/129

由于没有在2080Ti上测试，不知其结果如何，但在3060（12G版本）上仍然有以上报错。

突然想起，可以采用trtexec进行模型转换。

于是采用以下命令

trtexec --onnx=test.onnx --saveEngine=test_int8.engine --int8

成功将将模型进行转化，没有任何报错。

猜你喜欢

转载自blog.csdn.net/chan1987818/article/details/132870272

TensorRT量化INT8模型报错记录及解决方案

tensorrt int8量化原理几点问题记录

AI模型部署-TensorRT模型INT8量化的Python实现

TensorRT INT8量化原理与实现（非常详细）

int8量化

INT8量化总结

int8量化笔记

int8量化--调研

CNN模型 int8量化实现方式（二）

CNN模型 INT8 量化实现方式（一）

模型量化（int8）系统知识导读

TensorRT INT8量化原理以及如何编写校准器类进行校准

如何使用TensorRT中的INT8

AI大模型的神经网络模型量化技术：INT8 还是 INT4 ？

NCNN的INT8量化使用方式

OpenVINO 2022.3实战六：NNCF 实现 YOLOv5 模型 INT8 量化

OpenVINO 2022.3实战五：NNCF实现图像分类模型 INT8 量化

OpenVINO 2022.3实战四：POT API 实现 YOLOv5 模型 INT8 量化

OpenVINO 2022.3实战三：POT API实现图像分类模型 INT8 量化

使用OpenVINO实现 RT-DETR 模型 INT8量化推理加速

如何使用caffe进行int8和tensorrt训练

TensorRT下FP32转INT8的过程

YOLOV5 INT8 量化对比

Int8量化算子在移动端CPU的性能优化

openvino量化自己训练的yolov3模型至int8(有成功验证截图)

深度学习技巧应用17-pytorch框架下模型int8,fp32量化技巧

开发者实战 | 使用 OpenVINO™ 实现 RT-DETR 模型 INT8 量化推理加速

OpenVINO~RT-DETR模型INT8推理

TensorRT+ int8官方论坛中有趣的讨论总结

INT8 中的稀疏性：加速的训练工作流程和NVIDIA TensorRT 最佳实践

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)