1. Quantization Aware Training(QAT)
1.1 概述
https://github.com/NVIDIA/TensorRT/tree/master/tools/pytorch-quantization
TensorRT 的 pytorch_quantization 是一个实现 fake quantization
的 pytorch plugin
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# 2021-10-29 14:24
import os
import torch