Transmisión en vivo + X: una nueva tendencia en la industria de la transmisión en vivo

  //  

Nota del editor: los seres humanos buscan constantemente sentimientos y experiencias, y la tecnología de audio y video se está desarrollando rápidamente. Varias industrias necesitan con urgencia servicios de audio y video con una tendencia sin precedentes. Hoy en día, la transmisión en vivo ya es un término familiar para todos. El negocio y la ecología de la transmisión en vivo, así como las tecnologías de soporte clave, están en constante evolución e iteración, y están llenos de vitalidad. Esta estación de LiveVideoStackCon 2023 en Shanghái invitó a Huawei Cloud Lu Zhenyu a compartir con usted cómo hacer que "árboles viejos crezcan nuevos brotes" en la industria de la transmisión en vivo.

Texto/Lu Zhenyu

Editar/LiveVideoStack

Hola a todos, soy Lu Zhenyu de Huawei Cloud. Para no solo cubrir el sentido de participación de la gran mayoría de los oyentes, sino también permitir que todos ganen mucho, elijo compartir el tema de "Live + X", principalmente introduciendo nuevas tendencias y jugabilidad en la industria de la transmisión en vivo. .

01

Tendencias de la industria de transmisión en vivo

3521afd3fa6e6cc275fc6ee9b04e8cdf.jpeg

Nuestro equipo ha estado resumiendo el pasado para predecir el futuro o comprender el futuro tanto como sea posible. Los puntos centrales son los siguientes:

1. La tecnología multimedia, especialmente la tecnología de transmisión en vivo, no es la pila de tecnología de adquisición, codificación, transmisión, reproducción y reproducción de luz del lado final que la gente conoce actualmente. La transmisión en vivo o los medios de transmisión son un sistema integral y en constante evolución de múltiples tecnologías. :

①Desarrollo en el lado de la adquisición : Desde las pinturas de personas antiguas, hasta fotos más claras, hasta la tecnología de producción de escenas virtuales de éxitos de taquilla más claros y deslumbrantes.

②Desarrollo de métodos de distribución y consumo de video : al principio, la televisión usaba señales inalámbricas para transmitir video, luego apareció Internet y apareció el video en vivo. El nombre "transmisión en vivo de transmisión de medios" es la pila de tecnología que todos reconocen en la actualidad compuesta por Internet, colección de cámaras y PC.

③Desarrollo de extremo a extremo : desde televisores de cine hasta PC, teléfonos móviles y varios dispositivos inmersivos. Hasta donde yo sé, China Mobile también está promoviendo el desarrollo de la industria 3D a simple vista. Una pantalla que no es diferente de un teléfono móvil o una pestaña puede transformar el contenido en 3D a simple vista en cualquier momento, y el efecto es asombroso.

Desde la generación hasta la transmisión y desde el consumo hasta las terminales, se desarrollan en una tecnología integrada a través de una evolución continua. Nuestro equipo predice que habrá cambios revolucionarios en la forma en que se genera el video en el futuro, y las próximas dos décadas serán una oportunidad para que todos los profesionales la aprovechen. En el pasado, los videos se filmaban y generaban a través del modelado y renderizado 3D. En el futuro, deberíamos usar más la IA para generar contenido. Además, los métodos de transmisión y distribución también sufrirán cambios importantes, que trascenderán varias limitaciones de tiempo y espacio, y ya no solo verán videos en una dirección. Cuando los dispositivos de visualización de contenido se vuelvan inmersivos, las personas ingresarán al espacio en forma de dispositivos digitales. humanos y video Generan más interacciones.

Lo anterior es el primer punto para que podamos comprender toda la industria multimedia y de transmisión en vivo. No todos deben quedarse atrapados en el presente debido a las dificultades que enfrenta la industria hoy, sino que deben buscar oportunidades en el futuro.

2. La fuerza impulsora detrás del progreso tecnológico continuo es la experiencia de los consumidores, y la búsqueda de experiencia por parte de los consumidores es interminable. En términos generales, lo que hacemos a menudo ahora es imaginar que el emperador también come diez bollos al vapor y usa una azada dorada. terreno, pero en el futuro, una vez que haya innovación tecnológica, las necesidades de las personas se actualizarán en consecuencia. Estamos muy contentos de ver películas de gran éxito en 4K en casa, entonces, ¿qué experiencia buscarán los niños a nuestra edad? Por lo tanto, debemos aprender más sobre los pensamientos en los corazones de los niños y hacer realidad sus sueños.

La integración de la tecnología y la actualización continua de la experiencia son la fuerza motriz del desarrollo industrial, y también es el punto de partida para todo el diseño estratégico y comercial de HUAWEI CLOUD.

65bf923d3fc09420c1412515a3c63f58.jpeg

A continuación, reduzca el alcance. Desde la perspectiva de 2023, podemos ver que la transmisión en vivo está constantemente rompiendo las limitaciones de tiempo y espacio. Su alcance de aplicación y escenarios están aumentando. Hay dos tendencias principales de desarrollo:

1. La transmisión en vivo en China, especialmente en China continental, ha cambiado gradualmente de un sistema muy maduro a una infraestructura y capacidades globalizadas.

En China, este sistema tiene mucho éxito, por lo que es un ataque de reducción de dimensionalidad en muchos lugares del extranjero. Nos encontramos con un caso interesante. Un usuario estaba muy interesado en la transmisión en vivo de baja latencia de HUAWEI CLOUD y pensó que era adecuado para su experiencia comercial. Entonces probamos su negocio, pero el resultado no fue el ideal. Después de averiguar el motivo, descubrimos que el ancla está en Ucrania, la audiencia está en Singapur y otros países del sudeste asiático, y el requisito del cliente para nosotros es un retraso de 500 ms. Si observa este asunto con un pensamiento inercial doméstico, entonces nuestra llamada "transmisión en vivo de baja latencia" es falsa, y lleva más de diez segundos llevar la transmisión de Ucrania a Singapur. Esto nos inspiró a hacer mucha optimización para convertirlo en un servicio de transmisión en vivo en todo el mundo, lo que significa romper las limitaciones de tiempo y espacio. Eso sí, al final se controló el retardo a 500ms. A esto me refiero con la extensión continua del alcance temporal y espacial de los servicios.

Además, muchos escenarios de transmisión en vivo se están volviendo cada vez más populares. Por ejemplo, la transmisión en vivo es el método de transferencia más efectivo para la industria del reclutamiento. Además, hay entrega transfronteriza de bienes y los juegos de bombardeo recientemente populares, que todos están enriqueciendo la jugabilidad de la transmisión en vivo. La transmisión en vivo no es solo la infraestructura de la industria del entretenimiento, sino que también conquista constantemente ciudades y ayuda a otras industrias a mejorar la productividad.

8ba94b7646b9d8363569f59b85489871.jpeg

2. Ir más allá de la "realidad", transmisión en vivo desde contenido de filmación hasta transmisión generativa en vivo.

A la izquierda está el video tradicional filmado principalmente por PGC/UGC, el contenido es desde la misma perspectiva y la distribución es 1/N. Entonces, la tecnología que estamos discutiendo es la reducción de costos de CDN, que consume un poco de almacenamiento como máximo.

Ahora hay mucho contenido generativo, dividido principalmente en dos sistemas técnicos:

1. Renderizado generativo en tiempo real, generado por un motor de renderizado de gráficos por computadora. Vamos a usar triángulos para modelar todos los objetos y personas en una escena. Cómo expresarlo y convertirlo en contenido de alta calidad que pueda ser aceptado por los ojos humanos contiene mucho poder de cómputo GPU, y la interacción entre la audiencia y el contenido es 1:1.

2. AIGC genera generación de contenido, la aplicación más típica es la transmisión humana digital en vivo, incluido el consumo de energía de cómputo de muchos razonamientos de IA, y también es 1: 1 desde la perspectiva del espectador.

¿La IA reemplazará el renderizado en tiempo real? No lo creo, creo que CG y CV estarán profundamente integrados, se complementarán y promoverán entre sí.

Las razones son las siguientes: en primer lugar, si el razonamiento de la IA alcanza los 60 fps/s en el ángulo de generación de video, se trata de una transmisión en vivo. Sin embargo, actualmente es imposible lograr 1080p/60fps en escenas complejas como las escenas 3D. En segundo lugar, la representación basada en gráficos es insustituible en algunos escenarios. Por ejemplo, los escenarios industriales requieren personas o modelos con una precisión de 1 cm, que deben procesarse mediante la representación gráfica, que no puede ser manejada por métodos de IA.

Por lo tanto, las tecnologías de CG y CV estarán profundamente integradas durante mucho tiempo en el futuro. Solo cuando se hacen bien al mismo tiempo, seremos capaces de crear un buen contenido generativo.

Otro gran desafío de cambio es si el contenido debe distribuirse 1:1. ¿Qué tipo de poder de cómputo de ancho de banda se requiere? ¿Cómo popularizarlo a gran escala? Esto requiere el uso de algunas tecnologías de almacenamiento y cálculo, etc., de modo que la distribución futura estará en el estado de un RTC completamente punto a punto y CDN acelerado por caché. Los anteriores no miran hacia el futuro, no futuros, sino productos puntuales, que es la práctica continua de Huawei Cloud.

2fbf7bd57da55e73b32c10daa60eeb2c.jpeg

Live + X enfrenta muchos desafíos en su evolución, y el alcance del tiempo y el espacio continúa expandiéndose.¿Cómo podemos servir bien a los usuarios globales? ¿Cómo cumplir con sus requisitos de seguridad de latencia y experiencia compatible? ¿Cómo estar verdaderamente a la vanguardia, continuar mejorando la industria y permitir que el negocio de la transmisión generativa en vivo aporte valor rápidamente y a gran escala? ¿Cómo equilibrar los desafíos del crecimiento exponencial en el consumo de energía informática, la ocupación del ancho de banda entre pares y la latencia? ¿Cómo bajar el umbral técnico complejo?

02

Superar las limitaciones de tiempo y espacio

A continuación, presentaremos las prácticas relacionadas de HUAWEI CLOUD.

c81fe815061003c90ead00b23f5294ea.jpeg

Hay grandes oportunidades para romper las limitaciones de "tiempo y espacio".

De hecho, no estoy del todo de acuerdo con el término "negocios en el extranjero". Independientemente de si los chinos van al extranjero, los negocios en el extranjero están ahí. Presto más atención al negocio local. El espacio de ingresos de la transmisión en vivo es muy grande. Esto se refiere al espacio del servicio de transmisión en vivo en un sentido estricto. Se puede ver que desde la perspectiva de la madurez del negocio, Asia-Pacífico está un paso por delante, porque en el sudeste asiático, el sistema que ya conocemos es relativamente completo, seguido de América del Norte y Europa, en la actualidad, América del Sur está creciendo. muy rápido, y Kuaishou se ha lanzado con éxito en América del Sur.

Los cambios no son nuevos en el extranjero. YY se hizo pública en 2012 y fue pionera en China. Cuando trabajaba para Huawei en el sudeste asiático en 2013, un colega realizó un show en vivo en Indonesia. No lo entendí en ese momento. Porque la transmisión en vivo solo tenía negocios de entretenimiento en el sudeste asiático en ese momento, pero ahora la transmisión en vivo es una herramienta de productividad en estas regiones. En la región de Asia-Pacífico, todos han aceptado la transmisión en vivo de comercio electrónico transfronterizo, conferencias en vivo, competencias globales, ya sea en América del Norte, Asia-Pacífico o Europa, existen plataformas de transmisión en vivo de juegos locales que compiten con Huya. Douyu Escenarios generativos como conciertos virtuales y comunidades virtuales.

9c7f88271d510617aa213da1717736f7.jpeg

Tomando el sudeste asiático como ejemplo, la escala del comercio electrónico de transmisión en vivo ha alcanzado los US$ 19 000 millones este año , y la infraestructura comercial de circuito cerrado que empodera a la industria con la transmisión en vivo como herramienta de producción está completamente madura, incluidas las redes básicas y de pago. . Comparamos el ancho de banda de transmisión en vivo total de todos los fabricantes en China e Indonesia y lo dividimos por la población. El resultado es que la escala actual de transmisión en vivo en Indonesia es equivalente al nivel de China en 2018, y la transmisión en vivo nacional en 2018 se puede usar como quieras Siempre que los usuarios lo necesiten, los proveedores de CDN se expandirán. Una vez que la infraestructura de la red está en su lugar, Huawei ha construido estaciones base 5G y fibra hasta el hogar para estos países. De esta manera, hay un circuito cerrado comercial suficiente, de modo que la transmisión en vivo no solo se usa para ver televisión o mostrar contenido, sino que también se convierte en una herramienta de productividad.espacio para el desarrollo.

El capital chino no solo va al extranjero, sino que Huawei Cloud presta más atención a cómo encontrar y atender a los clientes locales de una manera práctica.

7366f2c51eebb281943835420d797510.jpeg

El Medio Oriente es un mercado en auge, caracterizado por una fuerte preferencia por las transmisiones en vivo de celebridades en línea, lo que puede deberse al desequilibrio entre la oferta y la demanda. La forma china de operar las MCN está en auge en Medio Oriente, lo que también es una gran oportunidad. Oriente Medio tuvo algunos problemas con 5G antes, pero en los últimos dos años, su infraestructura ha mejorado rápidamente.

8bcce9dbde943e40f5ee80df03a6037b.jpeg

Con tantas oportunidades y un espacio técnico tan grande, nuestra práctica es cómo ayudar a los clientes a realizar negocios en el contexto de la globalización con alta calidad . No se trata de ir al Medio Oriente para atender a los clientes del Medio Oriente, sino de cómo servir al mundo. Los clientes brindan servicios a sus empresas en todo el mundo. Por lo general, el pensamiento inercial de todos es que los usuarios están en China, la transmisión está en China y la transmisión también está en China, pero en los negocios reales, descubrimos que este no es el caso. En los negocios reales, los espectadores que envían la transmisión, la envían a la estación de origen, la envían a la CDN y finalmente la miran no están en el mismo país, lo cual es un gran desafío.

Para superar los desafíos anteriores, debemos hacer lo siguiente:

1. Resuelva el problema de la cobertura local : para los proveedores de la nube, tener una gran cantidad de recursos tiene una ventaja natural. En los últimos dos años, HUAWEI CLOUD ha lanzado Regiones recientemente en muchos lugares del mundo. He estado en algunos sitios como Indonesia, seguido de Turquía, Arabia Saudita y Sudáfrica. En la actualidad, hay 29 regiones en el mundo y todas son 3AZ de alto estándar. Las soluciones CloudOcean/CloudSea a gran escala ayudan a las regiones proporcionar potencia informática masiva y áreas circundantes Los recursos conectados suman hasta 83 AZ y más de 2800 nodos CDN.

2ee57b1b3456ebba55239623a3791c40.jpeg

2. Resolver el problema de la interconexión interregional : Después de tener suficiente infraestructura, ¿cómo atender mejor a los clientes y resolver los desafíos y escenarios mencionados anteriormente? Por ejemplo, el presentador ucraniano, sus necesidades nos impulsaron a hacer algo: la red ADN original era una red superpuesta de Superposición en la CDN, y esta red tuvo que implementarse en el extranjero para resolver este problema. Es algo abstracto de entender. La red CDN original es una estructura de árbol. Superponemos una red de aceleración de capa 3 y 4. Esto nos permite proporcionar una red superpuesta de tres capas de bajo costo y alta calidad.

El CDN original era todo el tráfico de norte a sur para resolver el problema 1: N. Ahora nuestros recursos también pueden resolver el problema de este a oeste para todos. Si no hay un enlace en el medio del negocio, como juegos en la nube, teléfonos en la nube u otros escenarios, siempre que haya Si el consumo es relativamente alto y el precio promedio del ancho de banda es superior a 10 yuanes, se puede usar este plan. Lo que es más importante es optimizar la calidad del tráfico norte-sur en el contexto de la globalización El lado derecho es un ejemplo específico de cómo lograr una gran cantidad de nodos en el contexto global e integrar varios factores para optimizar la ruta.

De acuerdo con la inercia pasada, solo se considera una red doméstica, pero al hacer negocios globales, se empalman docenas o incluso cientos de redes. Cada red tiene nodos de diferentes operadores, y la calidad de los nodos es diferente. El negocio de cada cliente es diferente, o cada usuario tiene múltiples negocios. La selección de enrutamiento original y la selección de parámetros de ajuste de calidad son para el escenario de una red en China, y solo se necesita un conjunto de parámetros para un cliente y un servicio. El contexto global nos impulsa a aislar los parámetros de todos los nodos de todos los operadores en todos los países y el negocio de todos los clientes y ajustar automáticamente cada parámetro en función de los grandes datos, de modo que diferentes inquilinos puedan elegir diferentes estrategias de enrutamiento para la red. El avión cumple con el Requisitos de SLA de las características comerciales del arrendatario.

c79dc72a70d64641c62ba68b6820b09e.jpeg

3. Resuelva el problema de la distribución de baja latencia : todos están familiarizados con la tecnología de baja latencia, y la esencia de la transmisión en vivo de baja latencia es que la primera tecnología de Google se produjo más rápido y antes en China. Por supuesto, muchas nuevas empresas de CDN en el extranjero tienen también eligió esta pista. Aunque los productos de fabricación nacional son muy populares en el extranjero, el uso limitado es un problema. La mayor limitación de la escena de uso proviene de la ecología, que proviene de la deficiencia natural de adaptarse a CA/DRM. Por lo tanto, hacemos un llamado a toda la industria para que se una y trabaje en conjunto para encontrar una solución a este sistema doméstico de transmisión en vivo rápido y de baja latencia en términos de DRM, para que todo el conjunto de estándares chinos pueda aprovechar.

De hecho, es muy doloroso para nosotros conectarnos con usuarios en el extranjero. Me pregunto si aún recuerdas el protocolo MSS. Es Microsoft Smooth Streaming, un protocolo muy antiguo. En el extranjero, por razones ecológicas, algunos televisores inteligentes de Samsung requieren que hagamos MSS. Afortunadamente, Huawei lo ha hecho y puede trasplantarlo desde el código base histórico. Es muy valioso estudiar la ecología de la transmisión en vivo de baja latencia. Es la forma de transmisión en vivo en el futuro. La transmisión en vivo, el contenido, la interacción y la visualización futuros requieren una latencia baja. ¿Podemos aprender de Microsoft, Google y Apple, y formar un grupo en esta ecología?

b9180b691610be1c1cb070c626690a6c.jpeg

4. Resuelva el problema de la operación global y la eficiencia del mantenimiento : después de tener una red de clientes, lo más importante para la operación y el mantenimiento globales es la visualización. La programación y la coincidencia de múltiples clientes mencionada anteriormente requieren visualización, principalmente a nivel de tráfico y nivel de aplicación. visualización, visualización de calidad, visualización de ancho de banda.

Esto implica una gran cantidad de recopilación de datos en la red Overlay de ADN.

6d01508658e9b15615316d5c08e3d05f.jpeg

Este es un caso de transmisión en vivo de baja latencia. Es la observación conjunta de usuarios turcos e indios. Juegan pequeños juegos mientras miran la transmisión en vivo. El juego pequeño requiere que la audiencia dé una respuesta dentro de un breve período de tiempo después de ver la transmisión. transmisión en vivo, por lo que se deja a la colección Solo se necesitan 500 ms para jugar, y las soluciones HLS, DASH y CMAF del cliente no se han resuelto.Al final, solo la transmisión en vivo de baja latencia de Huawei o la transmisión en vivo rápida pueden cumplir con su Necesidades del negocio.

03

más allá de lo "real"

c5dcc7208bb3917f21a6d94139162e2a.jpeg

No hace mucho, participamos en una reunión en vivo a puertas cerradas en la base de transmisión en vivo de Hangzhou. La tendencia en los próximos 20 años es AIGC. Muchos usuarios han dicho claramente que todos estarán en AIGC, pero AIGC está muy lejos para muchas personas. ¿Si todavía es ChatGPT, o modelos grandes, principalmente por publicación? Fuimos a la base de transmisión digital humana en vivo, que no es grande, pero la base despidió a todos los presentadores el 15 de abril y los reemplazó con transmisión digital humana en vivo. Fuimos a aprender cómo usar la transmisión humana digital en vivo, ¿qué significa esto para Huawei y dónde están nuestras oportunidades?

Después del intercambio, creemos que AIGC tiene una gran oportunidad. Esto incluye muchos escenarios de aplicación. Para dar algunos ejemplos, muchas estaciones de TV en el país y en el extranjero no están funcionando bien. Por ejemplo, Phoenix Satellite TV tiene un pequeño equipo técnico y están muy interesados ​​​​en usar la tecnología humana digital para el contenido. radiodifusión. Otro ejemplo es la transmisión en vivo de personas digitales y el surgimiento de tiendas digitales relacionadas con la inmortalidad en algunos centros comerciales, que pueden digitalizar a los ancianos y niños para el compañerismo emocional. Aunque estos escenarios aún son muy rudimentarios, en conjunto muestran que este es el futuro. tendencia de desarrollo Hay más escenas en el metaverso, como juegos en línea, ídolos virtuales, etc. Este ya no es un cambio provocado por la industria del entretenimiento o la tecnología de transmisión de medios, sino que se ha convertido en un factor de productividad en toda la industria.

Permítanme compartir con ustedes dos casos de negocios exitosos:

1. Entrega transfronteriza de mercancías en el sudeste asiático: según estadísticas incompletas, cada día se ejecutan más de 10.000 rutas comerciales. Estos incluyen una gran cantidad de transmisiones en vivo por personas digitales. La mayor fuerza impulsora detrás de esto es el abrumador bajo costo. Por ejemplo, vender un par de zapatos en el sudeste asiático tiene 20 idiomas en 20 países. Obviamente, es poco realista. para encontrar 20 presentadores para transmitir, por lo que puede comprar un par de zapatos. Hay varios presentadores digitales, transmisión en vivo las 24 horas del día, ya sea en indonesio, malayo u otros idiomas. Puede que sea el único hablante de bahasa indonesio en la sesión, pero eso no importa, mi gemelo digital puede hablar 20 idiomas. El surgimiento de los humanos digitales ha resuelto la barrera de la voz y llenado el vacío de los presentadores en vivo.

2. Caso en el ámbito social : La dama de la imagen resultó ser una celebridad de Internet con 1,84 millones de seguidores y un ingreso anual de 1 millón de dólares estadounidenses. Comenzó un servicio de novia virtual y muchas personas se suscribieron. En la actualidad, su ingreso anual ha alcanzado los 60 millones de dólares estadounidenses, que es comparable al de Taylor Swift. Si hay socios domésticos que quieren hacer negocios similares, podemos apoyarlo completamente.

3dbc7b516a614814a954e1b33520d077.jpeg

3. El caso del espacio 3D : Esto es relativamente simple, las personas digitales ven la transmisión en vivo en el espacio Metaverse. La imagen muestra la transmisión en vivo de Huawei.

619d36af7f7a3b190e46ddf305df5bc4.jpeg

901745fc92227f6f6be1ad375cdf9e7c.jpeg

Con tantos escenarios y tantas innovaciones mencionadas anteriormente, algunos pioneros ya han recogido los frutos, entonces, ¿cómo servimos como socios en la innovación comercial en esta industria ? umbral de uso de la tecnología.

La solución de HUAWEI CLOUD es desarrollar la transmisión humana digital en vivo de la marca MetaStudio. Tiene tres capacidades principales, creación de modelos, habilidades de transmisión en vivo y una tarjeta con diez canales, respectivamente correspondientes al umbral de entrada, operación efectiva y reducción rápida de costos. Finalmente, el humano digital está impulsado por el renderizado (principalmente correspondiente a una tarjeta y diez canales).

bec638cf1f497e7540fb65005dade495.jpeg

Hay tres métodos de fabricación de modelos:

1. Las palabras generan humanos digitales : Wen Shengtu, los gráficos generan humanos y la esencia es Wen Sheng humanos digitales. Ingrese la descripción de la imagen, y el ser humano digital se puede generar en aproximadamente 10 segundos, que se puede manejar más tarde.

2. Generar un humano digital a partir de una foto : una foto puede generar un humano digital en un minuto.

3. Generación humana digital a partir de video : se usa más en escenarios de transmisión humana digital en vivo, requiere cinco minutos de corpus y el entrenamiento varía de 3 a 6 para generar imágenes humanas digitales.

Además de las imágenes, los humanos digitales también necesitan hablar, para ello ofrecemos tres servicios de timbre:

1. Sonidos preestablecidos : sonidos de robot gratis,

2. Clon de tono : el efecto es un tono de transmisión de noticias típico, que proporciona audio de 3 a 5 minutos, los usuarios pueden hablar directamente mientras graban el video, solo envíenlo juntos. Aunque el timbre es mío, no hay emoción, y la narración es directa, el contenido se transmite en forma de transmisión de noticias y el grado de restauración puede llegar al 80%, lo que puede satisfacer algunas escenas.

3. Clonación de timbre de alta fidelidad : en situaciones como el transporte de mercancías, se requiere un timbre más cercano a la voz humana, lo que requiere una clonación de timbre de alta fidelidad. Necesita de 2 a 5 horas de material de sonido de nivel de estudio para el entrenamiento, que puede realizar el entrenamiento de los hábitos de habla del usuario, e incluso mantras de pronunciación, pausas y cambios emocionales que no puede detectar por sí mismo.La tasa de recuperación es del 95%, y el costo también es mayor.

4a12b8f106d39c65885e10e7a1b3e29b.png

9e5fd280f22033c80fa785c2a0820aa5.png

La figura es una demostración del doble modelo humano digital. El tiempo para entrenar al modelo es de 3 a 6 horas. El usuario solo necesita seleccionar el fondo, ingresar las palabras, incluidos los comentarios sobre la recompensa del obsequio de bombardeo, y luego iniciar la transmisión humana digital en vivo.

Lo que debe aclararse aquí es que, aunque se proporciona esta plataforma, Huawei no tiene la capacidad de iterar una gran cantidad de negocios, porque nuestro posicionamiento no es crear mucha gente y operarla, sino ayudar a los socios a crear costos. personas eficaces y de alta calidad. ,Proporcionar servicios. Hay API en el fondo de todas las capacidades, y se espera que los socios y clientes utilicen las capacidades a través de las API. Los socios pueden usar la plataforma para probarla, pero aún queremos enfatizar que no es el posicionamiento de Huawei convertirse en una plataforma SAAS lo que puede matar al Cuarteto en la transmisión digital en vivo u otros escenarios de aplicaciones.

d0ef934a486e9bac2900a628bbd7203c.jpeg

Además, también proporcionamos modelos a gran escala de habilidades digitales de transmisión humana en vivo. Hay muchos modelos, pero hablando objetivamente, no se puede confiar en ningún modelo a gran escala. Después de todo, no es realista confiar únicamente en personas digitales para transmitir en vivo y usar ChatGPT para hacer que la transmisión en vivo sea popular. Como resultado, junto con la tendencia, nació una nueva profesión: operador de transmisión en vivo humano digital. Muchos practicantes son sordomudos, lo que resolvió rápidamente el problema del empleo de los sordomudos. Las personas sordomudas tienen una voluntad muy fuerte para hablar, a pesar de sus limitaciones físicas, pero su ventaja es que están más enfocados en hacer cosas. Se convierten en operadores de transmisión en vivo humanos digitales y con la bendición de Pangu model o ChatGPT, pueden continuamente optimice e itere las habilidades de transmisión en vivo o las operaciones de transmisión en vivo, y encuentre la alegría de comunicarse con otros.

56a1cff1c784fef6ae224bbf8f50bd53.jpeg

Esta es una demostración a gran escala de habilidades de habla en vivo. Ingrese las indicaciones de habilidades de habla de productos básicos, como tipo de producto, precio original, precio actual, enlace No. 1, etc., y finalmente genere múltiples resultados.

0c9397b54e087fbcf2a33f52c761f2d4.jpeg

HUAWEI CLOUD brinda un servicio completo en términos de contenido generativo, y contamos con un poder de cómputo localizado de desarrollo propio . Los chips Huawei Ascend tienen soluciones para la transmisión generativa en vivo y el razonamiento de escenas futuras en términos de poder de cómputo, y continuarán optimizando estos escenarios en profundidad, brindando capacidades que no se pueden lograr en la serie Nvidia, como una tarjeta y diez canales requeridos para digital. generación humana espera.

La ventaja de HUAWEI CLOUD es ayudar a los usuarios a realizar rápidamente una transmisión generativa en vivo a través de la creciente potencia informática, la capa modelo por encima de la potencia informática, el algoritmo humano digital, la representación completa, la transmisión y un conjunto completo de soluciones para la plataforma de transmisión en vivo. .

Espero que este intercambio pueda transmitir el conocimiento y la comprensión de HUAWEI CLOUD de la industria y las oportunidades que ve para todos. Lo anterior es el compartir de este tiempo, gracias a todos!


7b7fa5dbf427e9f0f3049a8f57bc8293.jpeg

LiveVideoStackCon es el escenario para todos los técnicos multimedia. Si está a cargo de un equipo o empresa, tiene años de práctica en un determinado campo o tecnología y está interesado en los intercambios técnicos, bienvenido a postularse para ser productor/conferencista de LiveVideoStackCon.

Escanee el código QR a continuación para ver las condiciones de la solicitud del profesor, los beneficios del profesor y otra información. Envíe el formulario en la página para completar la solicitud de instructor. El comité organizador de la conferencia revisará su información lo antes posible y se comunicará con los candidatos calificados.

3f12aebc1c217fb3f2b76fdedc3b2b91.jpeg

Escanea el código QR de arriba 

Complete el formulario de solicitud de instructor

Supongo que te gusta

Origin blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/132073916
Recomendado
Clasificación