Audio y video - predicción intra

Codificación H264 (predicción intra)

En el modo de predicción intra, el bloque P predicho se forma en base al bloque de reconstrucción codificado y al bloque actual. Para los píxeles de luminancia, los bloques P se utilizan para operaciones de correlación en subbloques de 4 × 4 o macrobloques de 16 × 16. Hay 9 modos de predicción opcionales para subbloques de luminancia de 4 × 4, que predicen de forma independiente cada subbloque de luminancia de 4 × 4, lo que es adecuado para la codificación de imágenes con muchos detalles; 4 tipos de modos de predicción para bloques de luminancia de 16 × 16, prediciendo los bloques completos de luminancia de 16 × 16, adecuados para la codificación de imágenes en áreas planas; los bloques de croma también tienen 4 modos de predicción, similares a los modos de predicción de bloques de luminancia de 16 × 16. El codificador normalmente elige el modo de predicción que minimiza la diferencia entre el bloque P y el bloque codificado.

Modo de predicción de luminancia 4×4

Como se muestra en la Figura 6.14, los píxeles superior e izquierdo A~M del bloque luma 4×4 son píxeles codificados y reconstruidos, que se utilizan como píxeles de referencia de predicción en el códec. a~p son los píxeles a predecir, que se realizan utilizando valores A~M y 9 modos. Entre ellos, el modo 2 (predicción DC) se predice de acuerdo con los píxeles codificados en A~M, y los otros modos solo se pueden usar cuando se proporcionan todos los píxeles de predicción requeridos. Figura 6.15 Las flechas indican la dirección de la predicción para cada modo. Para los modos 3-8, los píxeles pronosticados se obtienen mediante el promedio ponderado de A-M. Por ejemplo, en el modo 4, d=redondo(B/4+C/2+D/4).

inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí

modelo describir
modo 0 (vertical) Expulsar verticalmente los valores de píxel correspondientes de A, B, C, D
Modo 1 (horizontal) Valor de píxel correspondiente derivado de los niveles I, J, K, L
Modo 2 (CC) Deduzca todos los valores de píxeles del valor promedio de A~D e I~L
Modo 3 (diagonal inferior izquierda) El valor de píxel correspondiente se obtiene por interpolación de píxeles en la dirección de 45°
Modo 4 (diagonal inferior derecha) El valor de píxel correspondiente se obtiene por interpolación de píxeles en la dirección de 45°
Modo 5 (vertical derecha) El valor de píxel correspondiente se obtiene interpolando el valor de píxel en la dirección de 26,6°
Modo 6 (nivel inferior) El valor de píxel correspondiente se obtiene interpolando el valor de píxel en la dirección de 26,6°
Modo 7 (vertical izquierda) El valor de píxel correspondiente se obtiene interpolando el valor de píxel en la dirección de 26,6°
Modo 8 (nivel superior) El valor de píxel correspondiente se obtiene interpolando el valor de píxel en la dirección de 26,6°

inserte la descripción de la imagen aquí

Modo de predicción 16×16

inserte la descripción de la imagen aquí

[Falló la transferencia de la imagen del enlace externo, el sitio de origen puede tener un mecanismo anti-leeching, se recomienda guardar la imagen y cargarla directamente (img-5Rt0ISof-1690336701808)(img/18.png)]

modelo describir
modo 0 (vertical) Deducir el valor de píxel correspondiente del píxel superior
Modo 1 (horizontal) Deducir el valor de píxel correspondiente del píxel izquierdo
Modo 2 (CC) El valor de píxel correspondiente se deriva del valor promedio de los píxeles superior e izquierdo
Modo 3 (plano) Use la función de "plano" lineal y los píxeles izquierdo y superior para derivar los valores de píxeles correspondientes, adecuados para áreas con cambios de brillo suaves

Modo de predicción de bloque de croma 8 × 8

Los componentes de crominancia de 8 × 8 de cada macrobloque intracodificado se predicen a partir de los píxeles de crominancia superiores izquierdos codificados, y los dos componentes de crominancia suelen utilizar el mismo modo de predicción.

Los 4 modos de predicción son similares a los 4 modos de predicción de predicción intra 16×16, pero los números de modo son diferentes. Entre ellos, DC (Modo 0), Horizontal (Modo 1), Vertical (Modo 2) y Plano (Modo 3).

inserte la descripción de la imagen aquí

Para el bloque actual C, el códec se calcula de la siguiente manera

probableprediction mode=

​          min{prediction mode of A, predictionmodes of B}

当A (或者 B)的预测模式不可用时,

​         prediction mode of A= 2.

Por ejemplo

Los modos de predicción para los bloques A y B son 3 y 1, respectivamente

   most probable mode for block C =1

El codificador envía una bandera para cada bloque 4x4 y el decodificador decodifica de la siguiente manera

Ifflag==1, prediction mode=most_probable_mode

Ifflag==0

   If rem_intra4×4_pred_mode< most_probable_mode

​     prediction mode=rem_intra4×4_pred_mode

   else

​     prediction mode=rem_intra4×4_pred_mode+1

Esto significa que solo se requieren 8 valores (0 a 7) para los 9 modos de predicción

inserte la descripción de la imagen aquí

Supongo que te gusta

Origin blog.csdn.net/qq_39431405/article/details/131932626
Recomendado
Clasificación