Aprendizaje de tecnología H.266 / VVC: tecnología CCLM de predicción intra

1. Principio de la tecnología CCLM

CCLM, el modo de predicción del modelo lineal de componentes cruzados (CCLM), la idea central de esta tecnología es reducir la redundancia de componentes cruzados y realizar la predicción de componentes cruzados, principalmente utilizando los píxeles de luminancia reconstruidos del mismo bloque de codificación para construir el valores predichos de píxeles de crominancia.

 

Entre ellos, pred_ {C} (i, j)representa el píxel de predicción de crominancia de la rec_ {L} ^ {'} (i, j)CU actual , representa el píxel de luminancia reconstruido de muestreo descendente de la CU actual \alfay se \betadenomina parámetro de modelo lineal, que se genera y deriva de los 4 píxeles de crominancia adyacentes y el correspondiente down -píxel de luminancia muestreado. Suponga que el tamaño del bloque de croma actual es W × H, luego W'y H'están configurados en

  • W '= W, H' = H cuando el modo actual es el modo LM;
  • W '= W + H cuando el modo actual es el modo LM-A;
  • H '= H + W cuando el modo actual es el modo LM-L;

La posición del píxel adyacente superior se representa como S [0, −1]… S [W'− 1, −1] y la posición del píxel adyacente a la izquierda se representa como S [−1,0]… S [-1, H '-1]. Los cuatro píxeles necesarios se seleccionan de la siguiente manera:

  •  Cuando se aplica el modo LM y los píxeles adyacentes superior e izquierdo están disponibles, S [W '/ 4, −1], S [3 * W' / 4, −1], S [−1, H '/ 4] , S [-1, 3 * H '/ 4];
  • Cuando se aplica el modo LM-A o solo están disponibles los píxeles adyacentes anteriores, S [W '/ 8, −1], S [3 * W' / 8, −1], S [5 * W '/ 8, - 1], S [7 * W '/ 8, -1];
  • Cuando se aplica el modo LM-L o solo están disponibles los píxeles adyacentes de la izquierda, S [−1, H '/ 8], S [−1, 3 * H' / 8], S [−1, 5 * H '/ 8], S [-1, 7 * H' / 8];

Cuatro píxeles de luminancia adyacentes reduciendo la resolución en la posición seleccionada, y después de cuatro comparaciones para encontrar los dos valores más pequeños: x_ {A} ^ {0}y x_ {A} ^ {1}, y dos valores más grandes x_ {B} ^ {0}y x_ {B} ^ {1}. Sus correspondientes muestras croma se expresa como y_{A}^{0}, y_{A}^{1}, y_{B}^{0}y y_{B}^{1}, a continuación, los parámetros se pueden calcular por la fórmula:

La siguiente figura muestra un ejemplo de las posiciones de los píxeles vecinos a la izquierda y los píxeles vecinos arriba, y un ejemplo del bloque actual involucrado en el modo CCLM.

Puede verse en la fórmula anterior que la división se produce durante el cálculo de α. Para evitar la operación de división, se utiliza el método de búsqueda de tabla para calcular α. Al mismo tiempo, para reducir el espacio de la tabla de almacenamiento, el valor diff (la diferencia entre el valor máximo y el valor mínimo) y α se expresan en forma exponencial. Por ejemplo, diff está aproximadamente representado por una parte significativa de 4 bits y un exponente. Por lo tanto, para 16 valores de bits válidos, la tabla 1 / diff se reduce a 16 elementos, como se muestra a continuación:

DivTable [] = {0, 7, 6, 5, 5, 4, 4, 3, 3, 2, 2, 1, 1, 1, 1, 0}

La ventaja de esto es que no solo reduce la complejidad del cálculo, sino que también reduce la cantidad de memoria requerida para almacenar las tablas requeridas.

Además del brillo de todos los píxeles de referencia superiores y los píxeles de referencia izquierdos para calcular conjuntamente los parámetros del modelo lineal, existen otros dos métodos de cálculo para los parámetros del modelo, es decir, el CCLM tiene dos dos modos, llamados LM- Modo A y LM-L.

  • En el modo LM-A, solo los píxeles de referencia superiores se utilizan para calcular los parámetros del modelo lineal. Para obtener más píxeles de referencia, los píxeles de referencia superiores deben expandirse a (W + H).
  • En el modo LM-L, solo se usa el píxel de referencia izquierdo para calcular los parámetros del modelo lineal. Para obtener más píxeles de referencia, el píxel de referencia izquierdo debe expandirse a (H + W).

Para los bloques no cuadrados, el píxel de referencia superior se expande a (W + W) y el píxel de referencia izquierdo se expande a (H + H).

Para hacer coincidir la posición de muestreo de croma de la secuencia de video 4: 2: 0, se proporcionan dos filtros de muestreo descendente para hacer que el componente de luminancia muestre un muestreo descendente de 2: 1 en las direcciones horizontal y vertical. La selección del filtro de reducción de resolución se especifica mediante el indicador SPS. Los dos filtros de reducción de resolución son los siguientes, correspondientes a "tipo-0" y "tipo-2":

 

Tenga en cuenta que cuando el píxel de referencia superior se encuentra en el límite de la CTU, solo se utiliza una fila de píxeles de luminancia para el muestreo reducido.

Este cálculo de parámetros se realiza como parte del proceso de decodificación, no solo como una operación de búsqueda del codificador. Por lo tanto, no se utiliza sintaxis para transferir los valores alfa y beta al decodificador.

 Dos, codificación técnica CCLM

Para la codificación intramodo de crominancia, se permite utilizar un total de 8 intramodos para la codificación intramodo de crominancia. Estos modos incluyen cinco modos tradicionales dentro del cuadro y tres modos de modelo lineal de componentes cruzados (CCLM, LM_A y LM_L). El proceso de codificación y derivación de la señal del modo de crominancia se muestra en la siguiente tabla. La codificación del modo cromático depende directamente del modo de predicción intra del bloque de luminancia correspondiente. Dado que se habilita una estructura de división de bloques separada para los componentes de luminancia y crominancia en el corte I, un bloque de crominancia puede corresponder a múltiples bloques de luminancia. Por lo tanto, para el modo de croma DM, se usa directamente el modo de predicción intra del bloque de luminancia correspondiente al píxel central del bloque de croma actual.

Modo de predicción de croma

Modo de predicción intra de luma correspondiente

0

50

18

1

X (0 <= X <= 66)

0

66

0

0

0

0

1

50

66

50

50

50

2

18

18

66

18

18

3

1

1

1

66

1

4

0

50

18

1

X

5

81

81

81

81

81

6

82

82

82

82

82

7

83

83

83

83

83

Independientemente del valor de sps_cclm_enabled_flag, se utiliza una tabla de binarización, como se muestra en la siguiente tabla.

Valor de intra_chroma_pred_mode

Cadena bin

4

00

0

0100

1

0101

2

0110

3

0111

5

10

6

110

7

111

En la tabla anterior, el primer contenedor indica si está en modo normal (0) o en modo LM (1). Si es el modo LM, el siguiente bin indica si es LM_CHROMA (0). Si no es LM_CHROMA, el siguiente bin indica si es LM-L (0) o LM-A (1). Para este caso, cuando sps_cclm_enabled_flag es 0, el primer bin de la tabla de binarización del modo de predicción intracroma correspondiente se puede descartar antes de la codificación de entropía. O, en otras palabras, se infiere que el primer bin es 0, por lo que no se realiza ninguna codificación. Esta única tabla de binarización se utiliza para sps_cclm_enabled_flag igual a 0 y 1. Los dos primeros bins de la tabla anterior utilizan su propio modelo de contexto para la codificación de contexto, y los bins restantes utilizan la codificación de bypass.

Además, para reducir el retardo luma-chroma en el árbol dual, cuando el nodo del árbol de codificación luma 64x64 no usa Not Split (y 64x64 CU no usa ISP) o QT para particionar, el chroma en 32x32 / 32x16 El nodo del árbol de codificación de croma está permitido. Las CU utilizan CCLM de la siguiente manera:

-Si el nodo de croma de 32x32 no está dividido o dividido QT de partición, todas las CU de croma en el nodo de 32x32 pueden usar CCLM

- Si el nodo de crominancia de 32x32 utiliza particiones BT horizontales y los nodos secundarios de 32x16 no se dividen ni utilizan la división de BT vertical, todas las CU de crominancia del nodo de crominancia 32x16 pueden utilizar CCLM.

En todas las demás condiciones de segmentación del árbol de codificación de luma y croma, no se permite CCLM para croma-CU.

 

Supongo que te gusta

Origin blog.csdn.net/BigDream123/article/details/107792708
Recomendado
Clasificación