Síntesis de voz - Aprendizaje TTS-VUE

Hoy, probé una herramienta de texto a voz de inteligencia artificial para mis amigos. Durante la prueba, descubrí que debería ser una herramienta de código abierto desarrollada por cierto maestro. Después de una tarde de pruebas, descubrí que hay algo para aprender Los amigos interesados ​​​​pueden reunirse para estudiar.

1. Breve introducción

El Asistente de Síntesis de Voz de Microsoft utiliza la poderosa biblioteca de voz de IA de Microsoft para generar audio de lectura cercano a la voz humana, que tiene características únicas. El sistema adopta la tecnología de síntesis de voz más avanzada. A través del aprendizaje profundo y el modelo de red neuronal, puede simular las características y expresiones del habla humana, haciendo que el audio sintetizado suene más natural y fluido.

El asistente de síntesis de voz de Microsoft tiene más de 20 actores de voz que han sido cuidadosamente seleccionados y entrenados para tener una expresividad de voz extremadamente alta y características de voz similares a las de los humanos. Las voces de estos dobladores abarcan diferentes edades, géneros y estilos de lenguaje, los usuarios pueden elegir los dobladores adecuados de acuerdo a sus necesidades, para que el audio sintetizado sea más acorde a sus preferencias y necesidades personales.

Además, la tecnología de texto a voz de la red neuronal también es compatible con una variedad de estilos de lectura, que incluyen transmisiones de noticias, servicio al cliente, gritos, susurros y otras expresiones de voz diferentes. Al mismo tiempo, la tecnología también puede reconocer y expresar emociones, como alegría, tristeza, etc., haciendo que el audio sintetizado sea más emotivo.

Ya sea en un lector de texto o en un Asistente habilitado para voz, el Asistente para síntesis de voz de Microsoft proporciona a los usuarios una experiencia de voz realista. Los usuarios pueden elegir el actor de doblaje y el estilo de lectura adecuados según la escena y las necesidades, lo que hace que el audio sintetizado sea más vívido y real.

2. Parámetros de demostración de prueba

Sistema operativo de demostración: Windows 11

Tipo de sistema: 64 bits

Versión de demostración: v1.9.10

3. Demostración básica

1. Vista previa del archivo

última versión a partir de ahora

Si hay una nueva versión, actualícela a tiempo, es posible que la versión anterior no sea compatible, el editor también actualizará las herramientas de aprendizaje a tiempo, para que todos puedan aprender

2. Demostración de instalación

Selecciona [Solo Yo Instalo], y la instalación de todos los usuarios requiere permiso de administrador

Elija dónde instalar

Una vez completada la instalación, puede abrir y ejecutar directamente

Al mismo tiempo, se creará un acceso directo en el escritorio.

3. Demostración de aprendizaje

Después de ingresar cualquier texto, puede ajustar la configuración en la barra de funciones derecha

Después de la configuración, puede hacer clic en [Iniciar conversión] para generar una vista previa y descargar

El archivo descargado no tiene sufijo, debe agregar el sufijo [.mp3] usted mismo

Cuarto, desinstalar después de aprender

Después de completar el estudio, debemos desinstalarlo. Primero podemos hacer [clic derecho] para encontrar [ubicación del archivo], hacer doble clic en [Desinstalar tts-vue] para desinstalar completamente la herramienta

Después de confirmar la desinstalación, haga clic en Siguiente

La velocidad de desinstalación es muy rápida, tan rápida que no hay posibilidad de tomar una captura de pantalla つ﹏⊂

5. Descarga y aprende

Portal:

http://ai95.microsoft-cloud.cn/d/9289114-56631256-53bd74?p=ai95

(Contraseña de acceso unificada: ai95) Actualización continua...

--

FIN

Supongo que te gusta

Origin blog.csdn.net/m0_63207326/article/details/131344712
Recomendado
Clasificación