Download Codificación bidimensional de patrones vocales mediante un

Document related concepts
Transcript
Codificación bidimensional de patrones
vocales mediante un esquema de reducción
dimensional basado en redes neuronales
Alejandro Bassi A.
Universidad de Chile
Departamento de Ciencias de la Computación
[email protected]
Caracterización fonética del timbre



oído interno descompone en frecuencias
escala no lineal
lo importante es la envolvente del espectro
Caracterización articulatoria del habla

bastan dos dimensiones
Relación articulación/timbre

posición de "formantes"
Codificación de la envolvente del espectro


cepstrum
reducción dimensional:
 lineal
(componentes principales)
 no lineal (redes neuronales)
 calidad de la reconstrucción
Reconstrucción lineal (2D)
Reconstrucción lineal (3D)
Reconstrucción lineal (4D)
Reducción dimensional con redes neuronales



estructura codificador/decodificador
entrenamiento autoasociativo
decodificador basado en composición gausiana
Codificación inicial
Codificación final
Reconstrucción (diptongos)
Posición de formantes
Reconstrucción (palabra: "cuatro")
Reconstrucción (otra palabra: "nueve")
Reconstrucción (diptongos, otro hablante)
Comparación entre hablantes
Conclusiones




buena reconstrucción (visualización)
reducción dimensional / seguimiento formantes
contexto general / contexto local
Reconocimiento de patrones (TDW, HMM)
¿varios hablantes?
 normalización
del "triángulo"