Download Redes neuronales artificiales: The Self

Document related concepts

Mapa autoorganizado wikipedia , lookup

Perceptrón wikipedia , lookup

Aprendizaje de cuantificación vectorial wikipedia , lookup

Transcript
Cuadernos de Estadı́stica Aplicada
Enero - Junio de 2014, Vol. I, No. 1
Redes neuronales artificiales: The Self-Organizing
Maps (SOM) para el reconocimiento de patrones.
Artificial Neural Networks: The Self-Organizing Maps (SOM) for
pattern recognition.
Ana M. Gómez1
Recibido: septiembre 19 de 2013.
Revisado: septiembre 24 de 2013.
Aprobado: diciembre 17 de 2013.
Resumen
Una herramienta exitosa para agrupar y visualizar datos n-dimensiones provenientes
de fuentes distribuidas y autónomas son las redes neuronales artificiales(ANN) por
sus siglas en inglés. Las ANN son vectores de cuantización (VQ-ANN) eficaces para
estudios con fines de clasificación, agrupación y reducción de dimensionalidad dado
que permiten describir la estructura topológica del espacio original del conjunto de
datos inicial, seleccionando las similitudes más importantes y representándolas como
relaciones espaciales entre las neuronas vencedoras en los datos de salida Salas et
al.(2011). La red neuronal SOM (Self Organizing Map), también conocida como los
mapas auto-organizados de Kohonen se creó con el fin de simular la abstracción sensorial de la información del entorno en los seres humanos de manera bidimensional. En
este documento se presentan los mapas auto-organizados que se obtienen cuando se
implementa una red SOM a través del toolbox nntraningtool de Matlab a un conjunto
de datos de contaminación del aire del 2011, en la ciudad de Santiago en Chile, junto
con la interpretación de las salidas sobre las asociaciones obtenidas por las neuronas
vencedoras.
Palabras clave: VQ-ANN, ANN, SOM, modelo neuronal, entrenamiento, estructura, toolbox.
Abstract
A successful tool to group and display data from n- dimensional distributed and
autónomous sources are artificial neural networks, Artificial Neural Network. The
1 Docente
de tiempo completo, Departamento de Ciencias Básicas, Institución Universitaria Los Libertadores. Bogotá, Colombia. E-mail: [email protected]
27
28
Ana M. Gómez
ANN are effective vectors for studies for classification, clustering and dimensionality
reduction quantization that allow to describe the topological structure of the original
space of the initial data set, selecting the most important similarities and representing
them as spatial relations between neurons in winning output data Salas et al.(2011).
The neural network SOM (Self Organizing Map), also known as self-organizing maps
of Kohonen was created in order to simulate the abstraction of sensory information from the environment in humans dimensional way. This paper presents the selforganizing maps which are obtained when implements a network SOM through the
toolbox nntraningtool from Matlab to a data set of 2011 air pollution in the city
Santiago of Chile, along with the interpretation of the outputs of the associations
obtained by the winning neurons.
Keywords: VQ-ANN, ANN, SOM, Neuronal Model, Training, Structure, Toolbox
1.
Introducción
Los avances sobre el aprendizaje de máquinas han permitido el desarrollo de
herramientas para el análisis y procesamiento de información debido al crecimiento tecnológico para la recolección y almacenamiento de datos de forma
distribuida y autónoma. Particularmente, disciplinas como la estadı́stica y la
informática encuentran solución o respuestas en diversos estudios aplicando
técnicas basadas en algoritmos evolutivos con el objeto de apoyar la toma de
decisiones o simplemente poder describir un fenómeno.
El desarrollo de las redes neuronales artificiales o ANN, por sus siglas en inglés, surge de las intenciones de simular el comportamiento de seres vivos. El
funcionamiento de las redes neuronales artificiales se basa en su arquitectura
y regla de aprendizaje fundamentada en un algoritmo adaptativo. La tarea
de clasificación y agrupación es una de las actividades más importantes en el
análisis de datos, la asignación o relación de objetos dentro de un conjunto de
categorı́as, establecidas o no, teniendo en cuenta las correlaciones, patrones o
similitudes entre ellos Salas et al.(2011).
La red SOM es un algoritmo evolutivo de aprendizaje competitivo no supervisado, muy útil para problemas en los que hay búsqueda e identificación de
estructuras (patrones o jerarquı́as entre los datos) o la reducción de la dimensionalidad sin perder información, dado su proceso de medir distancias entre
los datos formando grupos o conglomerados (clústers) a través del encuentro
de un representante o centroide por cada grupo.
Institución Universitaria Los Libertadores
Departamento de Ciencias Básicas
Redes neuronales artificiales...
29
Los datos de contaminación del aire son datos obtenidos de manera autónoma
y almacenados en fuentes distribuidas, es decir, la naturaleza de estos datos
difiere de las caracterı́sticas de centralización deseables para realizar un análisis clásico. Por tal motivo, la implementación de la red neuronal artificial SOM
es interesante para desarrollar un estudio de reconocimiento de caracterı́sticas
que permitan apoyar estudios sobre episodios de contaminación del aire Salas
et al.(2011).
En este documento se presenta de manera formal y descriptiva la estructura y el
aprendizaje de una red SOM y su aplicación a un conjunto de datos referidos a
lacontaminación del aire de la ciudad de Santiago, Chile. En la primera sección
se presenta de manera formal conceptos teóricos sobre el modelo neuronal
SOM, en la segunda sección se caracteriza la estructura y entrenamiento de la
red SOM con un enfoque descriptivo, en la tercera sección se exponen algunas
caracterı́sticas de los datos aplicados y aspectos de implementación del toolbox
de Matlab nntraningtool y en la cuarta y quinta sección se presentan y discuten
los resultados obtenidos de la implementación.
2.
Self-Organizing Maps (SOM)
Kohonen (1982) propuso el modelo neuronal de la red SOM con el objetivo de
demostrar que a partir de estı́mulos externos o datos de entrada de espacios
multidimensionales, la estructura propia de la red artificial puede describir
y proyectar la información abstraı́da en los estı́mulos, organizando datos de
salida en un mapa bidimensional. Un modelo SOM está compuesto por dos
capas de neuronas. La capa de entrada (formada por N neuronas, una por
cada variable de entrada) se encarga de recibir y transmitir a la capa de salida
la información procedente del exterior. La capa de salida (formada por M
neuronas) es encargada de procesar la información y formar el mapa de rasgos
de Palmer (2002), la figura 1 representa de manera intuitiva la estructura del
modelo de la Red (SOM).
Figura 1: Estructura de la Red SOM.
Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1
30
Ana M. Gómez
De manera descriptiva, el modelo de red SOM posee un algoritmo que caracteriza inicialmente los datos otorgando pesos wi j con valores muy pequeños
y aleatorios, ası́ presenta una entrada en forma de vector, notado como W̃ ,
donde cada componente serán números reales W̃ = (w1 j , w2 j , ...wi j ).
Cuando los datos ingresan a la red, esta analiza sus correlaciones, es entonces cuando las neuronas de la red reciben una señal representada por
X̃ = (x1 , x2 , ...xi )T . Ası́ las neuronas de la red empiezan a competir y la neurona
ganadora será aquella que tenga el valor más parecido a los pesos iniciales,
esto se obtiene calculando la distancia entre los
usualmente se usa la
vectores,
√
métrica Euclidea definida como d = (X̃, W̃ ) = X̃ − W̃ = ∑ni=1 (xi − wi j )2 .
Con la neurona ganadora se obtiene una vecindad, luego se reajustan los pesos
y se repetirá nuevamente el proceso. Las veces que la neurona vencedora es
reajustada se dedermina con la tasa de aprendizaje, la cual es una magnitud
de cambio entre 0 y 1 decreciendo en cada iteración. Comúnmente, esta magnitud se representa y se actualiza con la siguiente función α (t) = α0 +(α f − α0 ) ttα .
Donde, α f es la razón de aprendizaje final y tα es el número de iteraciones máxima para alcanzar α f . Durante el proceso de aprendizaje en el tiempo t los
vectores de referencia son cambiados iterativamente según la siguiente regla
de adaptación en Salas et al.(2011), donde W j (t + 1) = w j (t) + hc ( j,t)[xi (t) −
wi j (t)]; j = 1...M con hc ( j;t) será el Kernel asociado al clúster, generalmente
viene dado por una función gaussiana.
La red SOM tiene un aprendizaje competitivo no supervisado, el cual le permite ser muy útil para problemas en los que hay búsqueda e identificación
de estructuras (patrones de organización o jerarquı́as entre los datos) o la reducción de dimensionalidad sin perder información, con aras de encontrar el
ajuste del mejor modelo obtenido en cada iteración del algoritmo. Dado que
su proceso de medir distancias entre los datos forma grupos o conglomerados
(clúster), el encuentro de un representante por cada grupo (neurona vencedora) es el enlace a la proyección de un mapa de menor dimensión sin cambiar o
perturbar la estructura topológica de los datos de entrada de la red.
3.
Estructura y entrenamiento de una red SOM
La funcionalidad de los mapas auto-organizados de Kohonen o red SOM esta
en descubrir la estructura subyacente al conjunto de datos introducidos en la
red con fines de estudio. A continuación de forma descriptiva se presenta la
Institución Universitaria Los Libertadores
Departamento de Ciencias Básicas
Redes neuronales artificiales...
31
estructura y el entrenamiento de una red SOM :
Estructura
Matriz de neuronas: las neuronas de la red se distribuyen sobre un campo
o rejilla de dos dimensiones, esta puede ser rectangular, hexagonal entre
otras, de tal manera en la que se van identificando los grupos o clústers.
Espacio de entrada: el conjunto de datos de entrada se identifican como
un vector de N componentes, por cada atributo o correlación, determinado ası́ la dimensión del vector de pesos de inicialización.
Espacio de salida: corresponde al conjunto de datos de salida de la red
neuronal SOM en un mapa de menor dimensión al conjunto de entrada,
suele ser bidimensional.
Relación topológica entre neuronas: entre las neuronas existe una relación
de vecindad, la cual es subyacente al conjunto de datos debido a su estructura topológica natural. Lo más importante de esta relación es definir
la regla de asociación en la inicialización y aprendizaje de la Red Neuronal SOM.
Entrenamiento
En cada paso del entrenamiento de la red neuronal SOM, se introduce un
vector de datos de entrada y otro vector aleatorio correspondiente a los pesos de inicialización de cada neurona, se cuantifica la disimilitud entre ellos,
y la neurona vencedora será aquella que se encuentre más cerca a esa medida, formando clústers con las demás neuronas que se aproximen a la neurona
vencedora. En relación a este proceso, intuitivamente la aplicación en un software, la figura 2 es un mentefacto que representa el entrenamiento de una red
SOM.
Figura 2: Representación del entrenamiento de un red SOM.
Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1
32
3.1.
Ana M. Gómez
Los mapas auto-organizados de Kohonen en el análisis de datos
La definición y las caracterı́sticas de los mapas auto-organizados de Kohonen
forman un especial atractivo por las dos aplicaciones principales, la agrupación
y la reducción de dimensionalidad. Estas aplicaciones permiten que la visualización de los datos forme parte importante del análisis de datos. La red SOM,
además, posee las siguientes ventajas: la implementación es relativamente fácil,
el modelo es flexible y adaptable lo cual le permite ser mejorado y optimizado.
Dado su proceso de comparación de vectores el proceso de la red SOM permite
hacer una extracción muy clara de la naturaleza de los datos de entrada y
permite además que la misma técnica sea implementada en un gran variedad
de problemas, sin estar sujeta a cambios en la aplicación base.
La facilidad de fusión con otras técnicas, debido a su naturaleza abstracción
de información topológica subyacente en los datos de entrada. Los tres formas
básicas que se aplican para la visualización de datos en la red SOM se determinan por la visualización de las neuronas de entrada, la visualización de los
pesos de inicialización y la visualización de la matriz de distancias; estas formas también se pueden combinar entre si dotando al proceso de visualización
de más precisión y mejor calidad en los resultados.
4.
Aplicación SOM a datos de contaminación del aire
A continuación se presenta la caracterización de los datos de contaminación
del aire en la ciudad de Santiago de Chile y la estructura que define la red
SOM implementada.
4.1.
Datos de contaminación del aire en la ciudad de Santiago,
Chile
Para obtener el nivel de contaminación en el aire y ver sus efectos, el gobierno
de Chile maneja un sistema de seguimiento de las condiciones meteorológicas
y de calidad del aire a través del almacenamiento de datos registrados en las
estaciones de monitoreo del sistema de pronóstico MACAM − 3 para material
particulado y condiciones de ventilación, la cual está supervisada y dirigida
por el Ministerio del Medio Ambiente del gobierno de Chile.
Los datos de contaminación del aire son de libre acceso a través de la red
MACAM − 3 se pueden encontrar en dos tipos de categorı́as:
Institución Universitaria Los Libertadores
Departamento de Ciencias Básicas
Redes neuronales artificiales...
33
Datos crudos: corresponde a la información recibida en lı́nea, de forma
automática, desde las estaciones de monitoreo
Datos validados operacionalmente: corresponden a datos monitoreados
que han pasado por un proceso de validación por parte del operador de la
estación o la red de monitoreo, pero no constituye información ratificada
por la autoridad ambiental competente.
Se aplicó una red neuronal SOM para identificar patrones en datos de contaminación del aire en la estación de monitoreo de la comuna Las Condes,
ubicada en Santiago, Chile en relación a los 9 inputs (entradas) o parámetros
contaminantes. Los datos utilizados son de categorı́a validados operacionalmente, obtenidos de la página oficial del Ministerio del Medio Ambiente de
Chile (http://sinca.mma.gob.cl), con un total de 1.080 datos correspondientes
a los promedios diarios en el periodo de invierno, del 21 de junio al 21 de septiembre del 2011. La figura 3 de Santiago de Chile y la ubicación de la estación
de monitoreo Las Condes.
Figura 3: Ubicación de la estación de monitoreo Las Condes en Santiago, Chile.
La base de datos asocia los 120 dı́as correspondientes al periodo mencionado,
en relación a nueve parámetros considerados contaminantes en unidades ppb
(partes por billón), para los estudios de control de calidad del aire de Santiago
de Chile. Por lo tanto, la base de datos consta de 120 de datos por nueve
parámetros contaminante. Cada parámetro contaminante es un input, es decir
es un vector de entrada a la red identificados como:
Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1
34
Ana M. Gómez
Entrada:
Input1:
Input2:
Input3:
Input4:
Input5:
Input6:
Input7:
Input8:
Input9:
Nombre del parámetro contaminante.
Dı́oxido de azufre
Monóxido de nitrógeno
Dı́oxido de nitrogeno
Monóxido de carbono
Ozono
Metano
Óxidos de carbono
Hidrocarburos no metánicos
Material particulado respirable PM10
Tabla 1: Relación número Inputs con los parámetros contaminantes.
4.2.
Implementación de la red (SOM)
La estructura de la red SOM utilizáda está formada por una rejilla de 30 × 15
con topologı́a hexagonal y distancia Linkdist en la primera capa y en la segunda
capa una rejilla 8 × 8 con topologı́a hexagonal y distancia linkdist, la cual se
implementó a través del toolbox nntraningtool del software Matlab.
5.
Resultados de la aplicación
En el reconocimiento de los datos la red SOM genera un gráfico, ver figura
4, bidimensional de los pesos dominantes representados en los ejes X e Y.
Este reconocimiento de los datos es expresado por un grafo donde los nodos
(puntos grises) son los centroides de los clústers identificados y las lı́neas rojas
conectan neuronas vecinas. Es interesante observar como de forma natural la
red SOM relaciona la similitud entre los valores promedios correspondientes al
tamaño de las partı́culas de cada uno de los nueve parámetros contaminantes
y el tiempo en los cuales se obtuvo la información.
Figura 4:
Salida bidimensional donde se relacionan el número de dı́as de la recolección de los
datos y los centroides de los clústers que representa los diámetros aerodinámicos por
partı́cula.
Institución Universitaria Los Libertadores
Departamento de Ciencias Básicas
Redes neuronales artificiales...
35
La figura 5 presenta la visualización o mapeo de los datos de entrada en la
primera capa. Se muestra que a mayor oscuridad del gráfico se obtienen las
neuronas o conglomerados con más concentración de datos asociados por la
mı́nima distancia de los pesos iniciales de la red (SOM). Se puede apreciar
cómo la red SOM presenta el mapeo de cada uno de los nueve parámetros
contaminantes indicando de una manera espacial que los mapas se están relacionando por su tipo de conglomerado, observar los input 1,2,3 y 6 sombreando
el sector izquierdo de la rejilla y el sector izquierdo sur en los inputs 8 y 9 .
Figura 5: Visualización de los pesos de cada input o parámetro contaminante.
Finalmente como respuesta la red SOM entrega 64 neuronas vencedoras, debido a que la rejilla de la segunda capa fue de 8 × 8, que nos indican cuántos
datos del conjunto de entrada están asociados a cada una de ellas. En la figura
6 se presenta un mapa que identifica la rejilla mencionada y cuanto más oscuro
Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1
36
Ana M. Gómez
es el tono de gris en la neurona, más datos relaciona. Cada una de las neuronas presenta como etiqueta un número que representa la cantidad de datos
asociados.
Figura 6: Identificación de las neuronas vencedoras.
En la gráfica anterior observemos que las neuronas vencedoras con los datos
asociados de los 9 inputs o parámetros de contaminación se encuentran en
el sector centro izquierdo del mapa, lo cual coincide con lo observado en el
sombreado de los mapeos individuales por cada input o parámetro de contaminación.
Cada neurona contiene la información de cuántos datos se asocian por el
Institución Universitaria Los Libertadores
Departamento de Ciencias Básicas
Redes neuronales artificiales...
37
tamaño del diámetro aerodinámico, input al que pertenecen y al dı́a de recolección. Para etiquetar las neuronas vencedoras se enumeran en secuencia numérica de izquierda a derecha desde la parte inferior a la superior. A continuación
se presenta una tabla donde se relacionan los resultados de la neurona número
18 y se describen las caracterı́sticas que tienen los 13 datos asociados en ese
grupo o clúster.
Dato
1
2
3
4
5
6
7
8
9
10
11
12
13
Input
7
8
9
1
3
2
4
5
6
3
3
2
1
Diámetro (ppb)
47.67
37.95
42.70
56.90
49.86
48.68
42.67
47.87
49.98
43.48
39.86
55.62
47.6
Tabla 2: Descripción resultados neurona número 18.
Ası́ como se obtuvieron los datos asociados a la neurona 18, anteriormente
descrita (tabla 2), se puede analizar cada una de las neuronas de la figura 6 con
el fin de realizar interpretaciones más relevantes. Lo interesante fue observar
cómo a través de la implementación de una red SOM se pueden reconocer
patrones.
5.1.
Discusión de resultados
En este documento se presentan las interpretaciones sobre los resultados gráficos obtenidos de la implementación de una red SOM a un conjunto de datos de
contaminación del aire. La figura 6 es la más interesante debido a que contiene
la información de cuáles especı́ficamente son esos datos que se relacionan con
el diámetro aerodinámico de la partı́cula y al input al que pertenecen.
Para trabajos futuros se puede comparar los dı́as asociados en neuronas que
sean catalogadas como importantes con el fin compararlos con los dı́as que
Cuadernos de Estadı́stica Aplicada, Enero - Junio de 2014, Vol.I No.1
38
Ana M. Gómez
declarados como preemergencia o emergencia por el Ministerio del Medio Ambiente de Chile. Es decir, se puede proyectar esta técnica como una herramienta
útil en el apoyo en las tecnicas de análisis de episodios de alta contaminación
y su influencia.
Referencias
Kohonen, T. (1982), “Self-organized formation of topologically correct feature
maps”. Biological Cybernetics, vol. 43, pp. 59 - 69
Palmer A. (2002), “Metodologı́a de las ciencias del comportamiento”. Universitat de les Illes Belears. Technical Report.
Salas R. , Saavedra C., Allende H. (2011), “Machine Fusion to Enhance the
Topology Preservation of Vector Quantization Artificial Neural Networks”. Pattern Recognition Letters, Elsevier. vol. 32, issue 7, pp. 962972.
Institución Universitaria Los Libertadores
Departamento de Ciencias Básicas