Download ppt
Transcript
Aprendizaje No Supervisado y Redes de Kohonen Aplicaciones y Estado del Arte Hoy vamos a ver: • Organización Tímbrica de Instrumentos Musicales Utilizando Redes Neuronales. Néstor Spedalieri y Jorge Xifra. 2001. • Analysis and Downscaling Multi-Model Seasonal Forecasts using Self-Organizing Maps. J. Gutierrez et al. 2004. • Self Organization of massive document collection. Teuvo Kohonen et al. 2000. • Un clasificador neuronal que explica sus respuestas: aplicación al reconocimiento de dígitos manuscritos. Leticia Seijas. 2002 Organización Tímbrica de Instrumentos Musicales Organización Tímbrica de Instrumentos Musicales Utilizando Redes Neuronales. Néstor Spedalieri y Jorge Xifra. Tesis de Licenciatura. 2001. Organización Tímbrica de Instrumentos Musicales Timbre: “Atributo de la sensación auditiva en términos del cuál un oyente puede juzgar que dos sonidos presentados en forma similar son disímiles” • Objetivo: A partir de un sonido, detectar de qué instrumento proviene. • Características: – Utiliza transformada de wavelets para dividir el sonido por frecuencias – Utiliza dos capas de mapas de Kohohen Organización Tímbrica de Instrumentos Musicales Esquema del modelo Organización Tímbrica de Instrumentos Musicales Esquema del modelo: - - - Entrada: Nota C4 (262Hz, DO de la cuarta octava) de diferentes instrumentos musicales. Preprocesamiento: Transformada de wavelets para dividir por frecuencias. Compresión de las componentes más altas. Redes inferiores: Clasifican cada rango de frecuencias del sonido. El resultado es una posición de la grilla (x,y) para cada rango de frecuencias. Red superior: Clasificación final del sonido. Organización Tímbrica de Instrumentos Musicales Preprocesamiento - Mono - Ventana de tiempo: incluye ataque y una porción de la fase estable - Normalización de la intensidad (volumen) - Transformada de wavelets - Compresión de las frecuencias altas (para obtener 256 valores en cada una) Organización Tímbrica de Instrumentos Musicales Mapas inferiores - 15 mapas - Tamaño: 10x10 (para tener una relación de 1 a 5 entre la cantidad de entradas y de neuronas) - Dimensión de la entrada: 256 Organización Tímbrica de Instrumentos Musicales Parámetros - Cantidad de épocas: 256.000 para las inferiores y 150.000 para la superior para ordenamiento (para convergencia: 10%) - Eta inicial: 0.32 - Vecindario inicial: 10 Organización Tímbrica de Instrumentos Musicales Colección Masiva de Documentos Self Organization of massive document collection. Teuvo Kohonen et al. 2000. Colección Masiva de Documentos Objetivos - Clasificar un conjunto muy grande de documentos. Proveer una herramienta gráfica para visualizar la colección y navegar por la misma y para presentar los resultados de una búsqueda. - Verificar la escalabilidad de los mapas de Kohonen Cantidad de documentos: 6.840.568 (abstracts de patentes) Dimensión de la entrada: 500 Cantidad de neuronas: 1.002.240 Colección Masiva de Documentos Modelos estadísticos de documentos - Histograma de frecuencia de palabras (comprimido) Clusters de palabras Componentes principales Proyecciones aleatorias Colección Masiva de Documentos Construcción rápida de los mapas - Cómputo de la distancia: producto interno, almacenando sólo las componentes que no son cero. - Estimación de mapas grandes a partir de mapas más chicos: agregando filas y columnas. - Aceleración de la convergencia: guardando un puntero al último ganador para cada patrón de entrenamiento - Procesamiento paralelo Colección Masiva de Documentos Implementación - 6.840.568 documentos con 132 palabras en promedio - 733.179 palabras diferentes. Eliminando las palabras comunes y las que aparecen menos de 50 veces, quedan 43.222. - Proyección random de las palabras a vectores de dimensión 500. - Red final: 1.002.240 nodos. - Cuatro pasos. Red inicial: 435 nodos. Colección Masiva de Documentos Resultados Pronóstico meteorológico • Analysis and Downscaling Multi-Model Seasonal Forecasts using Self-Organizing Maps. J. Gutierrez et al. 2004. Pronóstico meteorológico Objetivos - Discriminar diferentes “configuraciones meteorológicas”. - Poder predecir fenómenos con antelación (por ejemplo, “El Niño”) Datos utilizados: - Diferentes registros meteorológicos de Perú, entre 1979 y 1999. Un patrón=un día Pronóstico meteorológico Se va a querer analizar la distribución de los datos y compararla con distribuciones conocidas. Arquitectura: - Preprocesamiento: componentes principales: de 7300 componentes se quedan con sólo 30! Pronóstico meteorológico Tamaño de la red: 8x8 (100 patrones por neurona) Pronóstico meteorológico Reconocimiento de Dígitos Manuscritos Un clasificador neuronal que explica sus respuestas: aplicación al reconocimiento de dígitos manuscritos. Leticia Seijas. 2002. Reconocimiento de Dígitos Manuscritos Objetivos: - Reconocer dígitos manuscritos - Poder detectar patrones dudosos, y obtener las posibles alternativas - “Explicar las respuestas”. Arquitectura: - Múltiples redes de Kohonen que clasifican el patrón considerando diferentes características - Un módulo analizador que combina las respuestas y emite una respuesta global Reconocimiento de Dígitos Manuscritos Reconocimiento de Dígitos Manuscritos - Cada red analiza una componente direccional Tabla de confiabilidad: indica el porcentaje de errores de cada red respecto de cada clase Umbral de confiabilidad: determina a partir de qué valor una respuesta se considera confiable. Funcionamiento: - Para una entrada dada, cada red determina a qué clase pertenece. - El módulo analizador suma los votos de cada red, ponderados por su confiabilidad. - La respuesta del sistema será la clase con mayor puntaje, si este sobrepasa el umbral de confiabilidad. Reconocimiento de Dígitos Manuscritos ¿Cómo se explican las respuestas? - Ante un patrón dudoso, se puede observar la decisión de cada una de las redes (jueces) y determinar qué características del patrón son similares a cada clase Reconocimiento de Dígitos Manuscritos Reconocimiento de Dígitos Manuscritos Reconocimiento de Dígitos Manuscritos Reconocimiento de Dígitos Manuscritos FIN