Hoy, probé una herramienta de texto a voz de inteligencia artificial para mis amigos. Durante la prueba, descubrí que debería ser una herramienta de código abierto desarrollada por cierto maestro. Después de una tarde de pruebas, descubrí que hay algo para aprender Los amigos interesados pueden reunirse para estudiar.
1. Breve introducción
El Asistente de Síntesis de Voz de Microsoft utiliza la poderosa biblioteca de voz de IA de Microsoft para generar audio de lectura cercano a la voz humana, que tiene características únicas. El sistema adopta la tecnología de síntesis de voz más avanzada. A través del aprendizaje profundo y el modelo de red neuronal, puede simular las características y expresiones del habla humana, haciendo que el audio sintetizado suene más natural y fluido.
El asistente de síntesis de voz de Microsoft tiene más de 20 actores de voz que han sido cuidadosamente seleccionados y entrenados para tener una expresividad de voz extremadamente alta y características de voz similares a las de los humanos. Las voces de estos dobladores abarcan diferentes edades, géneros y estilos de lenguaje, los usuarios pueden elegir los dobladores adecuados de acuerdo a sus necesidades, para que el audio sintetizado sea más acorde a sus preferencias y necesidades personales.
Además, la tecnología de texto a voz de la red neuronal también es compatible con una variedad de estilos de lectura, que incluyen transmisiones de noticias, servicio al cliente, gritos, susurros y otras expresiones de voz diferentes. Al mismo tiempo, la tecnología también puede reconocer y expresar emociones, como alegría, tristeza, etc., haciendo que el audio sintetizado sea más emotivo.
Ya sea en un lector de texto o en un Asistente habilitado para voz, el Asistente para síntesis de voz de Microsoft proporciona a los usuarios una experiencia de voz realista. Los usuarios pueden elegir el actor de doblaje y el estilo de lectura adecuados según la escena y las necesidades, lo que hace que el audio sintetizado sea más vívido y real.
2. Parámetros de demostración de prueba
Sistema operativo de demostración: Windows 11
Tipo de sistema: 64 bits
Versión de demostración: v1.9.10
3. Demostración básica
1. Vista previa del archivo
última versión a partir de ahora
Si hay una nueva versión, actualícela a tiempo, es posible que la versión anterior no sea compatible, el editor también actualizará las herramientas de aprendizaje a tiempo, para que todos puedan aprender
2. Demostración de instalación
Selecciona [Solo Yo Instalo], y la instalación de todos los usuarios requiere permiso de administrador
Elija dónde instalar
Una vez completada la instalación, puede abrir y ejecutar directamente
Al mismo tiempo, se creará un acceso directo en el escritorio.
3. Demostración de aprendizaje
Después de ingresar cualquier texto, puede ajustar la configuración en la barra de funciones derecha
Después de la configuración, puede hacer clic en [Iniciar conversión] para generar una vista previa y descargar
El archivo descargado no tiene sufijo, debe agregar el sufijo [.mp3] usted mismo
Cuarto, desinstalar después de aprender
Después de completar el estudio, debemos desinstalarlo. Primero podemos hacer [clic derecho] para encontrar [ubicación del archivo], hacer doble clic en [Desinstalar tts-vue] para desinstalar completamente la herramienta
Después de confirmar la desinstalación, haga clic en Siguiente
La velocidad de desinstalación es muy rápida, tan rápida que no hay posibilidad de tomar una captura de pantalla つ﹏⊂
5. Descarga y aprende
Portal:
http://ai95.microsoft-cloud.cn/d/9289114-56631256-53bd74?p=ai95
(Contraseña de acceso unificada: ai95) Actualización continua...
--
FIN