En 2023, ¿quién liderará la interacción en tiempo real hacia la era de la alta definición?

La práctica es el único criterio para probar la verdad, y la tecnología es la fuerza impulsora central para el progreso de la industria. En la nueva era de interacción en tiempo real, Acoustic Network, en constante evolución, ha completado la autocertificación. 

Autor|Dou Dou 

Producido | Industrial 

"Un cliente de la industria médica una vez nos presentó una demanda, con la esperanza de que en la escena de emergencia 120, la condición del paciente en tiempo real se pueda ver de forma remota, para que pueda tomar las medidas de emergencia más apropiadas". Shengwang CTO Zhongsheng nos dijo.

Este es uno de sus "nudos de corazón".

En los últimos años, con la optimización de la tecnología de distribución de video y el equipo de visualización de terminales, la calidad de imagen del contenido a pedido se mejoró sin precedentes y la ultra alta definición 4K se logró muy pronto. Sin embargo, en términos de interacción en tiempo real, la calidad de la imagen sigue estando por detrás del contenido regular bajo demanda.

La razón detrás de esto es que la mejora de la calidad de imagen de alta definición en vivo es diferente de la del hardware de terminal tradicional o del video a pedido, y existen umbrales técnicos muy grandes. Incluso si se resuelve el umbral técnico de claridad, vendrá acompañado de otros problemas que afectan la experiencia, como una mayor tasa de congelación, un mayor retraso en la red, etc.

De hecho, esta es exactamente la dirección en la que Shengwang ha estado atacando. Como el primer proveedor de servicios en la nube en brindar tecnología de audio y video en tiempo real como un servicio para empresas y desarrolladores, ya apareció en el "camino angosto" de la mejora de la calidad de la imagen interactiva en tiempo real.

Hoy, el camino angosto se ha ensanchado. " Existen varias tecnologías clave para mejorar la calidad de imagen de la interacción en tiempo real. En la primera mitad de este año, realizamos inversiones clave y mejoramos la calidad de imagen de las transmisiones en vivo de algunos clientes. Los comentarios muestran si es la calidad de imagen experiencia o el empoderamiento del negocio, el efecto Son todos muy significativos ". Como la persona a cargo de los productos de pan-entretenimiento de Shengwang, Liszt les dijo a los expertos de la industria.

"Supercalidad de imagen de alta definición en tiempo real", es hora de que más personas la vean.

1. ¿Qué tan difícil es una transmisión en vivo "real"?

Un grupo de datos estadísticos de la red de sonido muestra que el tiempo de retención promedio de los espectadores en los canales de baja definición, definición estándar y alta definición es de 290,95 s, 309,05 s y 340,12 s respectivamente; Es claramente visible que el tiempo de retención per cápita y promedio de los espectadores en los canales de alta resolución es significativamente mayor que el de los canales de media y baja resolución.

Si la calidad de la imagen es clara o no, se está convirtiendo en la clave para determinar los datos retenidos por los usuarios de transmisiones en vivo.

De hecho, ya sea una simple audiencia en una transmisión en vivo de entretenimiento o un consumidor en una transmisión en vivo de comercio electrónico, la experiencia de visualización real y los detalles reales del producto en calidad de alta definición se han convertido en una capacidad crucial para una transmisión en vivo.

Sin embargo, definitivamente no es una tarea fácil lograr una calidad de imagen de alta definición en escenas interactivas en tiempo real.

"Siempre hay fanáticos que se quejan de mi belleza falsa, pero el ajuste de parámetros al comienzo de la transmisión es muy complicado; si enciendes un poco la alta definición, Internet siempre será malo y se convertirá en un mosaico ; la calidad de imagen de esta plataforma solo puede soportar este efecto..."

Estas son algunas respuestas que obtuvo Shengwang cuando realizó una investigación sobre la calidad de imagen de una determinada plataforma.

El problema se presenta de múltiples maneras. El primero es la diferencia en la transmisión de ancho de banda.La diferencia en el ancho de banda global en tiempo real se está ampliando gradualmente.Los recursos de red del centro de transmisión en vivo son difíciles de cumplir con el acceso y distribución de video de una gran cantidad de usuarios. Así como 100 vehículos conducen desde el "ancla a la audiencia", el primero tiene una superficie de carretera más ancha que puede permitir que 100 vehículos circulen uno al lado del otro, mientras que el segundo tiene una superficie de carretera más estrecha que solo puede acomodar docenas o incluso menos vehículos. Por lo tanto, cuando aumenta la cantidad de automóviles, el tiempo para llegar al destino también se retrasará, lo que provocará un retraso en la transmisión en vivo.

En segundo lugar, existen grandes diferencias en el equipo , fragmentación severa y rendimiento desequilibrado. De hecho, las carreteras no solo se dividen en ancho y estrechez, sino también en términos de calidad. Cuando los parámetros del equipo terminal son bajos, significa que la carretera está llena de baches y los vehículos pueden estar congestionados y averiados en cualquier momento. causando bloqueos durante la transmisión en vivo.

Otra cosa es que la plataforma de emisión en directo, los equipos, el entorno, etc. restrinjan la producción de buenos contenidos . Cada plataforma de transmisión en vivo limitará los parámetros de la transmisión en vivo, lo que comprime en gran medida la calidad de la transmisión en vivo. Además, parámetros como la iluminación, el embellecimiento y los filtros también son factores importantes que reducen la calidad de la transmisión en vivo. En resumen, si la calidad del automóvil no es buena, no hay garantía de que pueda funcionar de manera eficiente.

Estos cuellos de botella inherentes hacen que sea imposible mejorar la calidad de la imagen en la interacción en tiempo real.

Hoy, este tema está más claramente puesto sobre la mesa. Es decir, con el auge de la transmisión en vivo de comercio electrónico y la transmisión en vivo de entretenimiento en el extranjero, las empresas tendrán requisitos más altos para la optimización de la calidad de la imagen; en segundo lugar, al tiempo que garantizan la claridad, también es necesario garantizar la fluidez de la transmisión en vivo y la experiencia general de calidad de imagen; Además, los proveedores de servicios deben proporcionar soluciones correspondientes de manera oportuna para algunos juegos nuevos en transmisiones en vivo.

Se puede ver que algunas empresas ya han tomado las contramedidas correspondientes. Por ejemplo, la mayoría de los presentadores optimizarán la calidad de la imagen cambiando el hardware del terminal, la iluminación y ajustando los parámetros de la plataforma. Por ejemplo, algunas plataformas o proveedores de servicios técnicos utilizarán algunos medios técnicos para optimizar la calidad de la imagen de las transmisiones en vivo.

Sin embargo, esta estrategia es un paliativo, no una cura. Es decir, cuando la red es inestable, el problema de la congelación sigue siendo inevitable y la mala experiencia de la interacción en tiempo real será "revelada".

En otras palabras, detrás de la necesidad de una transmisión en vivo "real" en el mercado, lo que más necesita el mercado de la transmisión en vivo es una solución integral que pueda resolver todos los aspectos de la calidad, la experiencia y el juego de la transmisión en vivo desde abajo.

¿Dónde está la respuesta?

2. Detrás del aumento del 10,3%

Consulte "Supercalidad de imagen HD en tiempo real"

El 10,3 %, que es el porcentaje de aumento en el tiempo de retención del usuario , proviene del monitoreo de datos de Shengwang antes y después de la actualización de la calidad de imagen del cliente. Detrás de este número está la "super calidad de imagen de alta definición en tiempo real" de la red de sonido.

"Desde nuestro propio análisis de datos hasta la verificación de datos del cliente, básicamente podemos ver una clara mejora en ambos extremos", dijo a la industria Zhu Chaohua, jefe de marketing de productos de Shengwang.

¿Cómo soluciona el cuello de botella técnico la "calidad de imagen estupenda HD·en tiempo real"?

"La supercalidad de imagen de alta definición en tiempo real de SoundNet no solo enfatiza una calidad de imagen más clara y mejor, sino también una alta definición de código bajo , que realmente ofrece una mayor claridad con el mismo ancho de banda o requisitos más altos en la red y el equipo con la misma definición. Solo de esta manera podemos realmente ayudar a los productos de transmisión en vivo, especialmente los productos en el extranjero, a tener una mejor experiencia de usuario frente a entornos complejos de redes y dispositivos", concluyó Liszt.

En la escena de la transmisión en vivo, muchos espectadores tienen una sensibilidad diferente a la calidad de imagen del contenido de la transmisión en vivo. En las transmisiones en vivo de entretenimiento, como maquillaje de belleza, presentaciones de talentos, etc., los espectadores son más sensibles a la calidad de imagen de los rostros; en las transmisiones en vivo de comercio electrónico, las audiencias son más sensibles a la calidad de imagen de los detalles del producto.

Por lo tanto, con base en el preprocesamiento de la percepción visual de la IA basada en el aprendizaje profundo, Acoustic Network realiza una baja compresión en contenido con alta sensibilidad de audiencia entre diferentes contenidos en vivo, y una alta compresión en contenido con baja sensibilidad, logrando un aumento del 30 % en la compresión de video. eficiencia. "Por ejemplo, la tasa de bits de transmisión original de 1 M se comprime a 0,7 M mediante un algoritmo de IA , de modo que se puede ejecutar fácilmente en dispositivos móviles de gama baja". en cuenta el cuello de botella de la fluidez. 

Luego, a través de la codificación de video multiformato y la confrontación de red débil, el video se distribuye de manera adaptativa. Actualmente, el nuevo estándar de codificación de video H.265 de la red de sonido puede ahorrar hasta un 50% del ancho de banda en comparación con el estándar de codificación H.264. 

Con 27 métodos de adquisición y renderizado, es compatible con varios equipos de adquisición y renderizado para obtener un mejor contenido de imagen. En la etapa de transmisión, Acoustic Network también adopta un algoritmo de transmisión elástico adaptativo para adaptarse a diferentes entornos de red. Luego, basado en el aprendizaje profundo, repara y mejora la calidad de la imagen de alta definición y ajusta de manera inteligente la nitidez y el contraste de la calidad de la imagen sin cambiar la resolución, para que la calidad de la imagen se vea más realista y hermosa.

Basada en la solidez de la tecnología subyacente, así como en la optimización continua y la tecnología iterativa, la solución "Supercalidad de imagen HD en tiempo real" se ha dado cuenta de las capacidades de alta definición extrema en toda la plataforma, superposición múltiple en tiempo real -Resolución en terminales móviles y capacidades de mejora de video.

Otro punto que sorprende aún más al mercado es que la optimización de Acoustics del bajo consumo del algoritmo de IA puede degradar automáticamente el algoritmo de la máquina de gama baja.

De acuerdo con los datos proporcionados por la red de sonido, la "Supercalidad de imagen HD en tiempo real" básicamente puede lograr una cobertura completa de los modelos de iOS en términos de adaptación del terminal; 95 % de cobertura de los modelos de Android , el modelo de configuración más bajo es OPPO A3s CPU single- El cuadro único core 720P toma solo 2.5ms.

El algoritmo de nueva generación puede ejecutarse en la mayoría de los modelos, lo que antes no era posible . Aunque la industria puede haber lanzado productos similares, pocos de ellos pueden ejecutarse en casi todos los modelos de gama alta, media y baja. Modelo", le dijo Zhong Sheng al industrial.

Lograr la mejora de la calidad de la imagen y las capacidades de superresolución requiere el uso de una gran cantidad de algoritmos de IA. Para adaptarse a la mayoría de los modelos, Acoustics incluso redujo los modelos grandes de la industria en 1 millón de veces . Zhong Sheng presentó: "Este camino es muy difícil. El desafío es lograr un efecto significativo de mejora de la calidad de la imagen mientras el modelo es lo suficientemente pequeño. Durante el proceso, la ruta y el método se cambiaron muchas veces. La superpuntuación que ve ahora es pulido La tasa de cobertura de la cuarta versión de la primera versión no está al mismo nivel que el modelo actual, y apenas puede llegar al 50% " . También es esta actitud extrema de "destruir hasta el final" lo que creó el " Súper imagen de alta definición en tiempo real "Calidad" es la evolución de la calidad de la experiencia.

3. Shengwang: base tecnológica, acompañante de experiencia

Entre los clientes de "Real-time HD·Super Image Quality", hay un caso que impresionó profundamente a Zhong Sheng. El cliente tiene dos aplicaciones, una planea adoptar la solución de Acoustics y la otra planea adoptar la solución CDN de menor costo.

El cambio se produjo después de que el cliente lanzara la solución Acoustics. "Decidió no usar CDN para otra aplicación, sino que también la reemplazó con la solución de Shengwang. Porque la experiencia de calidad de imagen mejoró significativamente y los datos operativos crecieron bien".

Zhong Sheng está muy satisfecho con este cambio y cree que después de una mejora en el consumo, es difícil bajar de categoría . Desde este punto de vista, la "Supercalidad de imagen HD en tiempo real" de Shengwang está empujando a toda la industria de la transmisión en vivo hacia una verdadera era de alta definición.

Otro cliente marítimo que transmite videos en vivo también ha experimentado un cambio similar. Las principales áreas de destino de la navegación marítima de este cliente son Turquía, Egipto e incluso Siria y otros países subdesarrollados del Medio Oriente. Debido a la infraestructura imperfecta en este lugar , la resolución de video de la plataforma no es alta, pero la tasa de Caton es alta.

"La mayoría de las empresas extranjeras piensan que la usabilidad es la primera prioridad. Cuando les promocionaron la alta definición por primera vez, sintieron que si no podían garantizar una baja velocidad de congelación y usabilidad, preferirían no tener alta definición ". Inicialmente solicitado "super"Calidad de imagen" es muy resistente, pero después de la optimización de la red de sonido y el efecto real, es muy reconocido. " Ayudamos a estos productos extranjeros a lograr una mejor experiencia de video y una tasa de congelación más baja " .

Con el fin de crear la mejor experiencia de transmisión en vivo, Shengwang mencionó la actualización de la experiencia de ocho módulos en la solución de "supercalidad de imagen de alta definición en tiempo real".

Específicamente, incluye una actualización integral de calidad de imagen clara y hermosa, real y texturizada; gente más hermosa, súper belleza de IA más natural. En el umbral del desarrollo de la API de belleza basada en escenarios, las más de 300 líneas de código originales se redujeron a 10 líneas y el tiempo de desarrollo se redujo de 7 días a 3 horas , lo que puede iniciarse rápidamente; sedoso y suave, los usuarios no tienen -entrada y salida de percepción, experiencia de cambio de canal y transmisión en vivo La salida del primer cuadro de la escena es tan baja como 100 ms, y  la segunda tasa de apertura es tan alta como 97% Puede realizar el mejor esquema de transmisión y codificación de tasa de código de la industria , con una reducción máxima de la tasa de código del 70% y un mínimo de 500K para lograr una experiencia de video fluida de 720p.

Además de los cuatro puntos anteriores, Shengwang también mejoró la experiencia de los métodos de juego, como la transmisión en vivo 1 contra 1 y la batalla en equipo PK. Al mismo tiempo, actualizó iterativamente varios aspectos, como la transmisión de PC, el monitoreo de datos, el seguimiento de ingresos comerciales y uno -dejar de actualizar el soporte técnico. Vale la pena señalar que al actualizar estas experiencias, casi no hay costo adicional , y la "calidad de imagen superior de alta definición en tiempo real" tiene un descuento de tan solo el 10%.

Esto es exactamente lo que constituye la "supercalidad de imagen de alta definición en tiempo real" y la popularidad de Shengwang en el lado del cliente.

De hecho, estas capacidades también se derivan de la acumulación de años de profundo cultivo de la industria por parte de Shengwang. Es decir, mientras Acoustics atiende a diferentes clientes, estos clientes corporativos también están empoderando a Acoustics a la inversa, ayudando a esta empresa líder en la pista de audio y video de China a continuar consolidando su nivel inferior y su volante de productos.

Para la red de sonido, la percepción del mundo exterior suele ser etiquetas de mercado generalizadas como audio y vídeo, RTC/RTE, etc. Pero en esta versión de "Supercalidad de imagen HD en tiempo real", lo que el mercado puede percibir no es solo su profundo cultivo de "tierra de nadie" en tecnología, sino también la infraestructura de este proveedor líder de servicios de audio y video de China. muchos productos evolucionan y se actualizan desde una perspectiva real de nivel inferior.

La práctica es el único criterio para probar la verdad, y la tecnología es la fuerza impulsora central para el progreso de la industria. En la nueva era de interacción en tiempo real, Acoustic Network, en constante evolución, ha completado la autocertificación.

Supongo que te gusta

Origin blog.csdn.net/chanyejiawang/article/details/132078495
Recomendado
Clasificación