CNN模型 INT8 量化实现方式（一） - 代码天地

CNN模型 INT8 量化实现方式（一）

其他 2018-12-03 09:11:08 阅读次数: 0

当前CNN模型基本都是 float32，将其转换为 INT8 可以降低模型大小，提升速度，精度降低的也不太多。那么在实际中如何实现这个量化了？在网上找到了两种实践方法，这里先介绍其中的一种。

这里主要涉及两个问题：1）就是 int8量化；2）就是 int8 模型的使用

基于Caffe-Int8-Convert-Tools进行caffe模型转int8量化在 NCNN 框架上运行
https://blog.csdn.net/u014644466/article/details/83278954

首先是基于 Caffe-Int8-Convert-Tools 这个工具进行 int8量化
https://github.com/BUG1989/caffe-int8-convert-tools

int8 模型的使用
How to use Int8 inference
https://github.com/Tencent/ncnn/pull/487
https://github.com/Tencent/ncnn/wiki/quantized-int8-inference#caffe-int8-convert-tools
In the default set, the inference using the Float32 mode,If you want switch the inference to Int8 mode,just need add 2 lines code,more details please see the examples/squeezenet-int8.cpp file.

......
ncnn::Net squeezenet;
squeezenet.set_conv_model(CONV_INT8);               //set the Int8 mode
squeezenet.load_param("squeezenet_v1.1.param");
squeezenet.load_scale("squeezenet_v1.1.table");     //parse the Int8 calibration table,also it's the quantize scale value
squeezenet.load_model("squeezenet_v1.1.bin");

NCNN 框架主要针对 android 优化的，

Q 支持哪些平台

A 跨平台，主要支持 android，次要支持 ios / linux / windows

Q 计算精度如何

A armv7 neon float 不遵照 ieee754 标准，有些采用快速实现(如exp sin等)，速度快但确保精度足够高

Q pc 上的速度很慢

A pc都是x86架构的，基本没做什么优化，主要用来核对结果，毕竟up主精力是有限的（

猜你喜欢

转载自blog.csdn.net/zhangjunhit/article/details/84562334

CNN模型 INT8 量化实现方式（一）

CNN模型 int8量化实现方式（二）

int8量化

模型量化（int8）系统知识导读

AI大模型的神经网络模型量化技术：INT8 还是 INT4 ？

AI模型部署-TensorRT模型INT8量化的Python实现

INT8量化总结

int8量化笔记

int8量化--调研

OpenVINO 2022.3实战六：NNCF 实现 YOLOv5 模型 INT8 量化

OpenVINO 2022.3实战五：NNCF实现图像分类模型 INT8 量化

OpenVINO 2022.3实战四：POT API 实现 YOLOv5 模型 INT8 量化

OpenVINO 2022.3实战三：POT API实现图像分类模型 INT8 量化

使用OpenVINO实现 RT-DETR 模型 INT8量化推理加速

NCNN的INT8量化使用方式

NCNN INT8实现

TensorRT量化INT8模型报错记录及解决方案

开发者实战 | 使用 OpenVINO™ 实现 RT-DETR 模型 INT8 量化推理加速

openvino量化自己训练的yolov3模型至int8(有成功验证截图)

深度学习技巧应用17-pytorch框架下模型int8,fp32量化技巧

TensorRT INT8量化原理与实现（非常详细）

tensorrt int8量化原理几点问题记录

YOLOV5 INT8 量化对比

Int8量化算子在移动端CPU的性能优化

OpenVINO~RT-DETR模型INT8推理

TensorRT INT8量化原理以及如何编写校准器类进行校准

深度学习算法优化系列 | Google CVPR2018 int8量化算法

openvino 将onnx转为IR并进行int8量化

int8使用sample

uint8 int8

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)