de procesamiento de dominio de tiempo (dos) las señales de voz

Por técnicas de procesamiento de dominio de tiempo cortos, las características de correlación de la señal de voz pueden ser obtenidos. Hoy en día, cómo sacar provecho de la función de autocorrelación a corto plazo de la extracción de un tono de la señal de voz.

Entonces, ¿qué es lo levantó? Cada cuerdas vocales se abren y cierran un período de tiempo llamado el periodo de tono o el tono, que se llama la inversa de la frecuencia fundamental, conocido como el terreno de juego. La longitud de las cuerdas vocales y de tono individual, espesor, dureza, rigidez y pronunciación hábitos relacionados, en gran parte refleja las características individuales. Además, el terreno de juego también con el sexo de la persona, la edad puede ser, los hombres mayores es bajo (alrededor de 50 Hz), los niños y las mujeres jóvenes es alta (alrededor de 450 Hz). El tono se utiliza principalmente en el habla de baja tasa de bits de codificación, el análisis y síntesis de voz, reconocimiento de voz y reconocimiento de hablante, ocupa una posición muy importante en el campo de la señal de voz.

A corto plazo fórmula función de autocorrelación:
Aquí Insertar imagen Descripción
función de autocorrelación a corto tiene una serie de características:
1) cuando k toma 0, el valor máximo de función en este momento es la función de autocorrelación de corta duración de la energía de la señal (véase el artículo anterior) ;
2) Si la secuencia señal original es un período durante el periodo T, entonces la función de autocorrelación es una función periódica de período T. Con esta característica, la señal de voz se puede calcular en el terreno de juego.

Para el castaño:

Aquí Insertar imagen Descripción
Aquí Insertar imagen Descripción
La figura se basa en la longitud de la tasa de muestreo, 44100Hz 0,9 segundos longitud de trama señal de voz se establece 1200, un desplazamiento del marco de 600, teniendo el marco rojo (parte vocal) de uno, como se muestra en la figura.
Aquí Insertar imagen Descripción

cierto marco de la figura (a) de la parte vocal

Aquí Insertar imagen Descripción

(B) de la función de autocorrelación para la trama

Desde el gráfico (b), después de retirar el primer valor máximo (0), un valor máximo en k = 236, entonces la velocidad de trama correspondiente a la frecuencia fundamental:

Aquí Insertar imagen Descripción
Además, la función de autocorrelación de corta duración también se puede utilizar para la detección de punto final, un juicio es la voz o el habla sin voz y así sucesivamente. Así, el contenido de la charla de hoy tanto, ver el próximo número!

Publicado 24 artículos originales · ganado elogios 2 · Vistas 4138

Supongo que te gusta

Origin blog.csdn.net/Leisure_ksj/article/details/104130362
Recomendado
Clasificación