procesamiento de dominio de tiempo (a) de la señal de voz

Es una señal de voz no estacionario, la señal variable en el tiempo. Sin embargo, ya que el discurso se hace por el pulso glotal excitación formando canales, y el canal, es decir, el movimiento de los músculos boca humana es lenta, de modo que en un "corto" se puede considerar un estado estacionario es una, señal invariante en el tiempo de la señal de voz. El "corto" se refiere generalmente 10 ~ 30 ms. Es debido a características de la señal del habla de "estado cuasi-estacionario", constituye una "tecnología de análisis en tiempo corto" señal de voz. Hoy en día, introducimos "análisis en tiempo corto" en el método de procesamiento de dominio de tiempo.

Antes de realizar las señales de habla de procesamiento de dominio de tiempo cortos, las señales de voz tienen que ser adquirido proceso de enmarcado, la longitud de trama y, en general 10 ~ 30 ms. Mientras tanto, si teniendo en cuenta los dos marcos adyacentes no se superponen, para calcular el terreno de juego (una apertura de las cuerdas vocales y cerrando cada vez que dicho periodo de tono o el tono, lo que se conoce como el recíproco de la frecuencia de paso, se hace referencia como tono) pueden saltar. En consecuencia, con el fin de realizar una transición suave se requiere entre dos adyacentes se solapan parcialmente. Además, la necesidad de datos agregados de cada función de una ventana de marco. La división de la trama de señal de voz, entonces el windowing se puede extraer características de la señal de voz en el tratamiento de dominio de tiempo.

Características de un: a corto plazo de energía y corto plazo amplitud media
Aquí Insertar imagen Descripción
por encima de fórmula: yi (n) es el valor de una, n = 1,2, ..., L , i = 1,2, ..., fn, L es la longitud de trama, fn es el número total de tramas después de la sub-trama.
A corto plazo la energía E (i) y el corto tiempo magnitud promedio M (i) representa la magnitud de la señal de voz podía energía. Se utiliza principalmente: para distinguir segmento de voz sonora y un segmento de voz no hablada, ya que la energía de corto plazo E (i) y la magnitud promedio de corta duración M (i) es mucho mayor que cuando la sorda voz; distinguir entre consonantes y vocales segmento de límite no tienen palabras límite (mostrado a continuación), entonces los segmentos.

Aquí Insertar imagen Descripción
Características II: promedio de la velocidad de paso por cero de corta duración

Representa un promedio de la tasa de cruce por cero de tiempo corto de una forma de onda de señal de voz a través de la frecuencia y el eje de abscisas (nivel cero). Para una adquisición de la señal discreta, si el valor cambia de símbolos adyacentes, se refería a la de cruce por cero. promedio de la tasa de cruce por cero de corta duración es el número de valores de muestra cambia de signo. La fórmula es como sigue:
Aquí Insertar imagen Descripción
el cálculo de promedio de la tasa de cruce por cero corto tiempo, las necesidades de datos originales que ser pre-eliminación de la componente de corriente continua, ya que afectará la componente continua de la actualidad estimación promedio de la tasa de cruce por cero es correcta.

En general, los medios de mayor frecuencia más alta de corta duración promedio de la tasa de cruce por cero, medios de baja frecuencia de un promedio de tasa de cruce por cero inferior de corta duración. En una señal de voz, no se determina la posición de inicio y final de la palabra del segmento no hay palabras, si el ruido de fondo es pequeña, la energía media de identificación más eficaz, si el ruido de fondo es grande, con un promedio de reconocimiento tasa de cruce por cero de corta duración es más eficaz ( como se muestra a continuación, el marco rojo, entonces no es un segmento que promedio de la tasa de cruce por cero de tiempo corto es baja), los dos métodos anteriormente descritos a veces identificados de forma conjunta. Además, la tasa de cruce por cero promedio de tiempo corto también puede ser expresado y la discriminación sorda.
Aquí Insertar imagen Descripción
Así, el contenido de la charla de hoy tanto, ver el próximo número!

Publicado 24 artículos originales · ganado elogios 2 · Vistas 4139

Supongo que te gusta

Origin blog.csdn.net/Leisure_ksj/article/details/104125171
Recomendado
Clasificación