Observador de cuantificación PyTorch

Observador de cuantificación PyTorch

clase basica

nombre tu heredas describir
ObservadorBase ABC, nn.Módulo Módulo observador base
UniformQuantizationObserverBase ObservadorBase

observador estándar

nombre tu heredas describir
MinMaxObserver UniformQuantizationObserverBase cálculo de los parámetros de cuantificación en función de los valores mínimo y máximo de ejecución
Promedio móvilMinMaxObserver MinMaxObserver calcular los parámetros de cuantificación en función de la media móvil de los valores mínimo y máximo
PorChannelMinMaxObserver UniformQuantizationObserverBase calcular los parámetros de cuantificación en función de los valores mínimo y máximo de ejecución por canal
Promedio móvil por canalMinMaxObserver PorChannelMinMaxObserver calcular los parámetros de cuantificación en función de los valores mínimo y máximo de ejecución por canal
HistogramaObservador UniformQuantizationObserverBase registra el histograma en ejecución de los valores del tensor junto con los valores mínimos y máximos.
marcador de posición observador ObservadorBase no hace nada y simplemente pasa su configuración al módulo cuantificado .from_float().
GrabaciónObservador ObservadorBase principalmente para depurar y registra los valores del tensor durante el tiempo de ejecución.
NoopObserver ObservadorBase no hace nada y simplemente pasa su configuración al módulo cuantificado .from_float().
FixedQParamsObserver ObservadorBase
ReutilizarInputObserverReuseInputObserver ObservadorBase

observador deficiente

nombre tu heredas describir
observador_predeterminado MinMaxObserver quant_min=0,
quant_max=127
marcador_de_posición_predeterminado marcador de posición observador Observador de marcador de posición predeterminado, generalmente utilizado para la cuantificación de torch.float16.
default_debug_observer GrabaciónObservador Observador predeterminado de solo depuración.
default_weight_observer MinMaxObserver dtype=antorcha.qint8,
qscheme=antorcha.por_tensor_simétrico
predeterminado_histograma_observador HistogramaObservador quant_min=0,
quant_max=127
default_per_channel_weight_observer PorChannelMinMaxObserver dtype=antorcha.qint8,
qscheme=torch.por_canal_simétrico
default_dynamic_quant_observer marcador de posición observador dtype=torch.float,
compute_dtype=torch.quint8
default_float_qparams_observer PorChannelMinMaxObserver dtype=torch.quint8,
qscheme=torch.per_channel_affine_float_qparams,
ch_axis=0
weight_observer_range_neg_127_to_127 MinMaxObserver dtype=torch.qint8,
qscheme=torch.per_tensor_symmetric,
quant_min=-127,
quant_max=127,
eps=2 ** -12
per_channel_weight_observer_range_neg_127_to_127 MinMaxObserver dtype=torch.qint8,
qscheme=torch.per_channel_symmetric,
quant_min=-127,
quant_max=127,
eps=2 ** -12
default_float_qparams_observer_4bit PerChannelMinMaxObserver dtype=torch.quint4x2, qscheme=torch.per_channel_affine_float_qparams,
ch_axis=0
default_fixed_qparams_range_neg1to1_observer FixedQParamsObserver scale=2.0 / 256.0,
zero_point=128,
dtype=torch.quint8,
quant_min=0,
quant_max=255
default_fixed_qparams_range_0to1_observer FixedQParamsObserver scale=1.0 / 256.0,
zero_point=0,
dtype=torch.quint8,
quant_min=0,
quant_max=255
default_symmetric_fixed_qparams_observer default_fixed_qparams_range_neg1to1_observer
default_affine_fixed_qparams_observer default_fixed_qparams_range_0to1_observer
default_reuse_input_observer ReuseInputObserver

Supongo que te gusta

Origin blog.csdn.net/m0_70885101/article/details/131955469
Recomendado
Clasificación