Monografias.com > Sin categoría
Descargar Imprimir Comentar Ver trabajos relacionados

Parametrización en el Análisis de la voz (página 3)




Enviado por Pablo Turmero



Partes: 1, 2, 3

Monografias.com

4.- Análisis de predicción lineal
Cálculo de los coeficientes de predicción:
Son aquellos que minimizan el error de predicción (la energía del error de predicción)

Minimizar: Para cada ak derivar e igualar a 0

Obtenemos un sistema de P ecuaciones con P incógnitas

Monografias.com

4.- Análisis de predicción lineal
Cálculo de los coeficientes de predicción:

Monografias.com

4.- Análisis de predicción lineal
Cálculo de los coeficientes de predicción:

Sistema de ecuaciones:

Monografias.com

4.- Análisis de predicción lineal
En forma matricial:
R es una matriz Toeplitz
Ecuaciones de Yule-Walker

Monografias.com

4.- Análisis de predicción lineal
Algoritmo de Durbin:
Solución recursiva para calcular los coeficientes ak aprovechando que R es toeplitz.
Inicio:

Recursión: i=1,…,P
(Gp:) Energía residual

(Gp:) Coef. Reflexión
(PARCOR)

(Gp:) Coef. LPC

Monografias.com

4.- Análisis de predicción lineal
Algoritmo de Durbin:
Calcula los coeficiente de reflexión (PARCOR)
Calcula los coeficientes de predicción lineal a partir de los de reflexión
El filtro resultante siempre es estable:
|km|<1

Filtro obtenido: IIR todo polos

Monografias.com

4.- Análisis de predicción lineal
Cálculo de las frecuencias de los formantes:
A partir de los ak calcular las raíces del polinomio
El cálculo de estas raíces debe hacerse de forma aproximada por métodos numéricos ya que no puede hacerse de forma analítica para polinomios grandes
(Gp:) 0 Hz
(Gp:) Fs/2 Hz

Monografias.com

4.- Análisis de predicción lineal
Orden de predicción:
Un par de polos complejos conjugados por cada formante
Añadir dos o tres polos más
En general P suele estar entre 10 y 14 coeficientes
LPC-5
LPC-14
LPC-10

Monografias.com

4.- Análisis de predicción lineal
Modelo de producción de voz:
(Gp:) Excitación
Periódica
(Gp:) Ruido
Aleatorio
(Gp:) Pitch
(Gp:) Envolvente
espectral
(Gp:) G
(Gp:) Parámetros
Espectrales
(Gp:) Voz

Monografias.com

4.- Análisis de predicción lineal
A partir del error de predicción y del filtro LPC podemos obtener s[n]:
(Gp:) e[n]
(Gp:) s[n]

Monografias.com

4.- Análisis de predicción lineal
Con el filtro LPC inverso y la señal de voz podemos obtener la señal de error:
(Gp:) s[n]
(Gp:) e[n]

Monografias.com

4.- Análisis de predicción lineal
Filtros LPC y LPC inverso:

Al pasar s[n] por el filtro LPC inverso obtenemos e[n]
e[n] además de ser la señal de error es la señal de excitación del modelo de producción de voz

Monografias.com

4.5.- Método SIFT, estimación del Pitch
Simplified Inverse Filtering Technique, Markel 1972.
(Gp:) F. Paso Bajo
0-900 Hz
(Gp:) Diezmado
5:1
(Gp:) Análisis LPC
P=4
(Gp:) Filtro LPC
Inverso
(Gp:) Autocorrelación
(Gp:) Localizar
Máximo
(Gp:) Interpolación
(Gp:) ¿Sonoro / sordo?
Estimar F0
(Gp:) x[n]
(Gp:) e[n]
(Gp:) S[n]
Fs = 10 kHz

Monografias.com

4.5.- Método SIFT, estimación del Pitch
Filtrar paso bajo con fc = 900Hz.
Esto nos permite reducir Fs de 10 kHz a 2 kHz.
Desechamos 4 de cada 5 muestas.
Realizamos un análisis LPC de orden 4.
No es necesario más: hasta 1000Hz como máximo 2 formantes.
Procesamos x[n] con el filtro inverso LPC.
Obtenemos e[n] que será la señal de excitación.
Calculamos la autocorrelación de e[n].
Localizamos el mayor valor dentro del rango de pitch probables.
Para obtener mayor resolución en la estima del pitch, interpolamos la autocorrelación en la región del máximo.
Si el máximo obtenido (normalizado por R[0]) no supera un umbral, suponer que el segmento es sordo.

Monografias.com

5.- Análisis espectral localizado
5.1.- Conceptos de percepción auditiva

MEL: Escala de frecuencias de distribución no lineal que responde al mecanismo de percepción auditiva

Con esta escala medimos la frecuencia en MELs, es la frecuencia percibida aparente.

Conversión de Hz a MELs

Monografias.com

5.2.- MEL-Frequency Cepstrum (MFCC)
Coeficientes cepstrales derivados del análisis sobre la escala MEL
Calculamos el espectro
Calculamos el Log del módulo (cepstrum real)
Aplicamos la escala MEL
Agrupamos frecuencias en bandas críticas
Calculamos la DCT

(Gp:) FFT
(Gp:) DCT
(Gp:) Escala MEL
(Gp:) Log

Monografias.com

5.2.- MEL-Frequency Cepstrum (MFCC)

Monografias.com

5.2.- MEL-Frequency Cepstrum (MFCC)
0
1000
2000
3000
4000
5000
6000
7000
0
0.2
0.4
0.6
0.8
1
[Hz]
0
2
4
6
8
10
12
14
16
18
-10
-8
-6
-4
-2
0
Banco de
filtros
Espectro
suavizado

Monografias.com

5.2.- MEL-Frequency Cepstrum (MFCC)
Cepstrum obtenido:
El número de coeficientes resultante es muy inferior
El cepstrum obtenido es una aproximación
(Gp:) 0
(Gp:) 2
(Gp:) 4
(Gp:) 6
(Gp:) 8
(Gp:) 10
(Gp:) 12
(Gp:) 14
(Gp:) 16
(Gp:) -0.5
(Gp:) 0
(Gp:) 0.5
(Gp:) 1

Monografias.com

5.3.- Cepstrum LPC (LPCC)
Es posible obtener los coeficientes cepstrales a partir de los coeficientes LPC
Obtendremos el cepstrum de una señal suavizada
No es necesario calcular el espectro

Partes: 1, 2, 3
 Página anterior Volver al principio del trabajoPágina siguiente 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Categorias
Newsletter