La transcripción de voz se puede hacer en tiempo real y los subtítulos se pueden sincronizar para la transmisión en vivo

En la era de la explosión de la información, se ha vuelto particularmente importante organizar video, audio, texto y otra información de manera eficiente y con alta calidad. Escenarios tales como reuniones, conferencias, entrevistas, llamadas de atención al cliente, etc., deben formar materiales escritos completos, y los archivos de audio y video también deben ir acompañados de subtítulos. La inteligencia de la conversión de voz a texto permite la entrada de información instantánea y eficiente.

La transcripción de voz en tiempo real está disponible en aplicaciones de transmisión en vivo, conferencias y toma de notas. Por ejemplo, en conferencias de audio y video, el contenido de los discursos se puede visualizar y las actas de las reuniones se pueden generar en tiempo real, lo que es conveniente para grabar y modificar, y mejora la eficiencia de las reuniones; en aplicaciones de transmisión en vivo, las palabras habladas por el ancla puede ser reconocido, a fin de lograr el efecto de "hablar y enviar mensajes de texto", mejorar la experiencia de visualización del usuario y crear una mejor atmósfera de transmisión en vivo; en aplicaciones para tomar notas, admite el contenido clave para ser grabado y grabado para capturar cada uno de sus pensamientos.

El servicio de aprendizaje automático HMS Core proporciona capacidades de transcripción de voz en tiempo real, lo que permite a los desarrolladores crear funciones largas de voz a texto en sus aplicaciones. Puede convertir flujos de audio como registros de reuniones, notas, resúmenes y contenido de audio y video en vivo en resultados de datos de flujo de texto en tiempo real, para realizar el reconocimiento en tiempo real del contenido de voz y mostrar el contenido de texto correspondiente.

Puede admitir 5 horas continuas de entrada de voz larga en tiempo real en texto, no solo puede generar signos de puntuación, sino que también puede generar información de texto con marcas de tiempo. Ya sea que hable chino mandarín, inglés, francés o incluso una mezcla de chino e inglés, puede reconocerse bien para satisfacer las necesidades de diferentes escenarios.

Despliegue de transcripción de voz en tiempo real

Mostrar resultados

En la pantalla de efectos, podemos ver que el texto convertido por la función de transcripción de voz en tiempo real se puede editar, copiar, modificar, etc. inmediatamente después del final, lo cual es muy conveniente.

Precauciones

• Actualmente, el servicio de transcripción de voz en tiempo real en francés solo es compatible con teléfonos móviles Huawei y Honor, y el servicio de transcripción de voz en tiempo real en chino e inglés es compatible con todas las marcas de teléfonos móviles.

• El servicio de transcripción de voz en tiempo real completa el servicio de identificación accediendo a la interfaz del lado de la nube.Durante la puesta en marcha y el uso, asegúrese de que el dispositivo pueda acceder a Internet con normalidad.

Pasos de desarrollo

1. Configure la información relevante en AppGallery Connect.

Antes de desarrollar una aplicación, debe configurar la información relevante en AppGallery Connect.

Para la preparación específica del desarrollo, consulte la documentación .

2. Configure la dirección del almacén de Maven del SDK de HMS Core.

2.1 Abra el archivo "build.gradle" a nivel de proyecto de Android Studio.

2.2 Agregue el complemento HUAWEI agcp y la base de código Maven.

Configure la dirección del repositorio de Maven del SDK de HMS Core en todos los proyectos->repositorios.

allprojects {
    repositories {
        google()
        jcenter()
        maven {url 'https://developer.huawei.com/repo/'}
    }
 }
在buildscript->repositories里面配置HMS Core SDK的Maven仓地址。
buildscript {
    repositories {
        google()
        jcenter()
        maven {url 'https://developer.huawei.com/repo/'}
    }
 }

Agregar configuración en buildscript -> dependencias.

buildscript{
    dependencies {
         classpath 'com.huawei.agconnect:agcp:1.3.1.300'
    }
 }

3. Cree un reconocedor de voz y establezca la configuración.

MLSpeechRealTimeTranscriptionConfig config = new MLSpeechRealTimeTranscriptionConfig.Factory()
    // 设置语言,目前支持中文、英语、法语转写。
    .setLanguage(MLSpeechRealTimeTranscriptionConstants.LAN_ZH_CN)
    // 设置标点。
    .enablePunctuation(true)
    // 设置句子的偏移。
    .enableSentenceTimeOffset(true)
    // 设置词的偏移。
    .enableWordTimeOffset(true)
    .create();
MLSpeechRealTimeTranscription mSpeechRecognizer = MLSpeechRealTimeTranscription.getInstance();

4. Cree una devolución de llamada de escucha de resultados de reconocimiento de voz.

// 回调实现MLSpeechRealTimeTranscriptionListener接口,实现接口中的方法。
Protected class SpeechRecognitionListener implements MLSpeechRealTimeTranscriptionListener{
    @Override
    public void onStartListening() {
        // 录音器开始接收声音。
    }
 
    @Override
    public void onStartingOfSpeech() {
        // 用户开始讲话,即语音识别器检测到用户开始讲话。
    }
 
    @Override
    public void onVoiceDataReceived(byte[] data, float energy, Bundle bundle) {
        // 返回给用户原始的PCM音频流和音频能量,该接口并非运行在主线程中,返回结果需要在子线程中处理。
   }
 
    @Override
    public void onRecognizingResults(Bundle partialResults) {
        // 从MLSpeechRealTimeTranscription接收到持续语音识别的文本。
    }
 
    @Override
    public void onError(int error, String errorMessage) {
        // 识别发生错误后调用该接口。
    }
 
    @Override
    public void onState(int state,Bundle params) {
        // 通知应用状态发生改变。
    }
}

5. Enlace el reconocedor de voz.

mSpeechRecognizer.setRealTimeTranscriptionListener(new SpeechRecognitionListener());

6. Llame a startRecognizing para iniciar el reconocimiento de voz.

mSpeechRecognizer.startRecognizing(config);

7. Una vez completada la identificación, finalice la identificación y libere los recursos.

if (mSpeechRecognizer!= null) {
    mSpeechRecognizer.destroy();
}

Para obtener más detalles>> Visite el sitio web oficial de Machine Learning Service Alliance para obtener el documento de guía de desarrollo del servicio de aprendizaje automático Visite el sitio web oficial de Huawei Developer Alliance
para obtener el documento de guía de desarrollo
Huawei Mobile Services Open Source Repository Address : GitHub , Gitee

Síguenos para conocer la última información técnica de HMS Core por primera vez ~

{{o.nombre}}
{{m.nombre}}

Supongo que te gusta

Origin my.oschina.net/HMSCore/blog/5527465
Recomendado
Clasificación