[Interpretación de tesis] Algoritmo de selección de modo rápido x264 basado en juicio jerárquico

Introducción

Título: Algoritmo de selección de modo rápido X264 basado en juicio jerárquico
Original: https://www.nstl.gov.cn/paper_detail.html?id=77880ade9a55b3cc527192010242d90e
Nivel: EI
Año: 2010
Institución: Universidad Jiaotong de Shanghai
Conclusión: Comparado con la búsqueda de movimiento HEX El algoritmo ahorra un promedio del 27 % del tiempo de codificación, con cambios insignificantes en la calidad y la tasa de bits.
Descarga de recursos: https://download.csdn.net/download/yanceyxin/88036641?spm=1001.2014.3001.5503

Interpretación de tesis

principio fundamental

x264 adopta un algoritmo de juicio de patrones flexible y detallado, que es significativamente más rápido que el método exhaustivo sin perder el rendimiento de compresión.Gran costo de codificación, por lo que el proceso de juicio se puede omitir, por el contrario, si el rendimiento de predicción del modo de tamaño pequeño es bueno, el modo de gran tamaño se puede omitir, la relación anterior se denomina principio de monotonicidad de tamaño; P8x8 juzga y utiliza la relación relativa entre los costos de codificación de los dos modos anteriores para determinar si el macrobloque es adecuado para tamaño grande codificación de modo o codificación de modo de tamaño pequeño, y luego guía el proceso de selección de otros modos.

Los pasos generales del algoritmo interno x264:
■ Si hay un bloque de salto en el bloque adyacente del espacio aéreo, realice el juicio de modo de salto, si se pasa, use el modo de salto y termine antes, ■
juicio de p16x16, si el residuo es lo suficientemente pequeño, y el vector de movimiento M es similar al bloque adyacente, proceda con la evaluación del modo de omisión, si se pasa, use el modo de omisión y termine antes; ■
p8x8 predicción entre fotogramas;
■ si Cp8x8 < Cp16x16, use el modo Psub8x8 para optimizar el modo P8x8;
■ si Cp8x8 + Cmv(tr) + Cmv(dl) < Cp16x16 , para juzgar P16x8 y P8x16; (esta pieza es diferente del último código x264, debería ser Cp8x8 < Cp16x16) + Cmv(tr) + Cmv(dl)), donde Cmv(tr) y Cmv(dl) representan la parte superior derecha /El costo de codificación del vector de movimiento del submacrobloque en la posición inferior izquierda ■ Realice la
evaluación I16x16, si 2Cinter < CI16x16 y b=1, no menor I8x8 e I4x4 se realizará el juicio y terminará (este bloque no es exactamente igual que en el último código x264 Igual, en x264, salta directamente a intra y juzga el orden de i16x16, i8x8, i4x4) ■ Realiza el juicio I4x4
;
■ Selecciona el mejor modo;

Redundancia en el algoritmo de selección de modo rápido de x264:
■ Los macrobloques dentro del cuadro ocupan una proporción objetiva en muchas secuencias de video.Si los macrobloques adecuados para la codificación dentro del cuadro se pueden detectar de antemano, se puede omitir la redundancia del juicio del modo entre cuadros; p8x8 consume recursos informáticos significativos y la probabilidad de ocurrencia es limitada. El proceso de juicio innecesario
para p8x8 traerá mucha redundancia informática,

Selección del modo de mejora del juicio jerárquico
■ Para la predicción entre cuadros, deje que P16x16 y skip sean el modo principal, y el resto son modos auxiliares ; Garantiza la calidad de compresión básica, y el modo auxiliar desempeña un papel en la optimización del rendimiento de codificación;
■ El modo el juicio primero expande el modo principal, y luego construye varias condiciones de juicio basadas en los resultados del juicio del modo principal para decidir si omitir cada modo auxiliar, la condición de falla del modo auxiliar entre cuadros: ● Para identificar
inserte la descripción de la imagen aquí
macrobloques
que son no es adecuado para la codificación entre cuadros por adelantado sobre la base de los resultados del juicio del modo principal, por lo que se salta el proceso de juicio de otros modos entre cuadros; la superioridad
solo proviene del tamaño de predicción más pequeño, pero el costo de los dos es similar, por lo tanto, se concluye que el modo principal puede proporcionar una estimación básica del costo de codificación del modo auxiliar óptimo durante la predicción interna ● Cuando el costo de codificación del modo principal entre cuadros es significativo Cuando es mayor que el
intra- Modo principal de cuadro, la probabilidad de que el costo de codificación del modo auxiliar entre cuadros sea mayor que el del modo intra-cuadro también es muy alta.En este momento, el modo auxiliar entre cuadros no es válido y se puede omitir el juicio ; ● Cuando el contenido de video cambia drásticamente, el costo de codificación del macrobloque actual
P16x16 En comparación con el costo de codificación p16x16 de los bloques vecinos en el dominio del tiempo, el costo de la codificación p16x16 aumentará considerablemente, y es más ventajoso usar la predicción intra en esta vez;
En segundo lugar, los macrobloques dentro del cuadro a menudo tienen continuidad espacial, y el bloque actual adopta La probabilidad de codificación del modo intra también es mayor;
inserte la descripción de la imagen aquí
las condiciones efectivas del modo principal del cuadro intermedio:
● Para identificar el macrobloque adecuado para codificar en modo P16x16 por adelantado sobre la base del modo principal de la trama intermedia, para omitir el proceso de evaluación del otro modo intermedio, de acuerdo con el principio de monotonicidad de tamaño, esta condición se puede realizar mediante la operación de umbral;
● El costo de codificación P16x16 es inferior a cierto umbral, el modo principal se considera bueno y se omite el proceso de inspección del conjunto de modo auxiliar;
● Use la fórmula 1 anterior para obtener el bloque vecino en el dominio del tiempo y use su costo de codificación final como el umbral de terminación anticipada del macrobloque actual, donde x, y representan las coordenadas del macrobloque actual, xref, yref representan las coordenadas de el bloque vecino en el marco de referencia en el dominio del tiempo, Mx y My representan los componentes del vector de movimiento del macrobloque actual en las direcciones X e Y. ● Teniendo en cuenta el espacio
para la optimización en la fórmula 1, agregue la fórmula 3 para determinar si un se produce un cambio
inserte la descripción de la imagen aquí

Pasos específicos para el cálculo del umbral:
○ Encuentre el macrobloque de referencia en el dominio del tiempo mediante la fórmula 1. Si se cumple la fórmula 3, agregue su mejor costo de codificación entre cuadros a la lista estadística
y si se cumple la fórmula 3, hable sobre la mejor codificación entre cuadros. y agréguelo a la lista estadística;
○ Encuentre la media del costo de referencia Ce en la lista estadística, si el macrobloque actual no cuenta con ninguna información de referencia de umbral, establezca Ce=0; ○
Si Ce < 16SAD (QP), entonces Ce = Ce + 12SAD (QP); (Este paso debe corregirse y ajustarse cuando el umbral es pequeño)
○ Almacenar el costo de codificación entre fotogramas óptimo actual para proporcionar una referencia para el cálculo del umbral del siguiente fotograma;

Algoritmo de selección de modo auxiliar entre fotogramas mejorado:
herede el algoritmo original de x264, para mejorar la probabilidad de que se omita el modo Psub8x8, primero pruebe p16x8/p8x16 y use el resultado para guiar el proceso de juicio de Psub8x8; ----
Cuadro Proceso de selección de modo interasistido:
○ Predicción entre cuadros P8x8;
○ Si Cp8x8 + Cmv(tr) + Cmv(dl) < Cp16x16, juzgue P16x8 y P8x16; (esta pieza es diferente del código, debería ser Cp8x8 < Cp16x16) + Cmv(tr) + Cmv(dl)), donde Cmv(tr) y Cmv(dl) representan respectivamente el costo de codificación del vector de movimiento del submacrobloque superior derecho/inferior izquierdo; ○ Si min(Cp8x8, Cp16x8, Cp8x16) = Cp8x8
, Use Psub8x8 para optimizar P8x8;

Descripción general del algoritmo
inserte la descripción de la imagen aquí

Aplicado al segmento B
● Debido a que el segmento B generalmente se usa menos en rtc, no se presentará en detalle; consulte el texto original;

resultado

inserte la descripción de la imagen aquí

Supongo que te gusta

Origin blog.csdn.net/yanceyxin/article/details/131668680
Recomendado
Clasificación