Download 019 - UNNE

Document related concepts

Aprendizaje de cuantificación vectorial wikipedia , lookup

Perceptrón multicapa wikipedia , lookup

Propagación hacia atrás wikipedia , lookup

Redes neuronales probabilísticas wikipedia , lookup

Perceptrón wikipedia , lookup

Transcript
UNIVERSIDAD NACIONAL DEL NORDESTE
Comunicaciones Científicas y Tecnológicas 2000
Comparación de Topologías MLP y LVQ de Redes Neuronales
para la Detección de Arritmias Ventriculares
Barbosa, Lucrecia - Kleisinger, Gretchen H. - Valdez, Alberto D. - Monzón, Jorge E.
Departamento de Ingeniería Eléctrica - Facultad de Ciencias Exactas - UNNE.
9 de Julio 1449 - (3400) Corrientes - Argentina
Teléfono: +54 (03783) 423126 - Fax: +54 (03783) 474930 - E-mail: [email protected]
ANTECEDENTES
La aplicación de las redes neuronales artificiales se ha extendido a diversas disciplinas, debido principalmente
a sus características de adaptividad, confiabilidad y auto-organización. Una ventaja destacable para el
procesamiento de datos radica en la posibilidad de su implementación con tecnologías específicas disponibles,
que posibilitan su operación en tiempo real.
Dos de las topologías de red más difundidas son el Perceptron Multicapa (MLP – Multilayer Perceptron) y el
denominado Modelo de Kohonen.
Perceptron Multicapa (MLP). El Perceptron Multicapa se caracteriza por presentar una no-linealidad en la
salida, capas de neuronas ocultas y un alto grado de conectividad. Es de entrenamiento supervisado. Utiliza el
algoritmo de retro-propagación del error. Este algoritmo está basado en la regla de aprendizaje por
corrección de error, considerada como una generalización del algoritmo de los cuadrados mínimos (LMS),
utilizado en filtrado adaptivo mediante redes lineales simples (Haykin, 1994). Su operación consta de dos
fases, una directa y una inversa o de retroceso. En la fase directa, se ingresa el patrón de actividad en la capa
de entrada de la red (vector de entrada), que recorre todas las capas subsiguientes. Se obtiene la respuesta real
de la red en la capa de salida. En esta fase, los pesos sinápticos de la red permanecen fijos. En la fase inversa,
los pesos sinápticos son ajustados de acuerdo con la regla de corrección del error. Esta regla, conocida como
método de Levenberg-Marquardt (Marquardt, 1963), minimiza el cuadrado de las diferencias entre la
respuesta o salida deseada y la salida real de la red. Las redes del tipo MLP son muy utilizadas en el
procesamiento de bioseñales cardíacas para el diagnóstico médico (Harrison y col., 1991; Baxt, 1992)
Modelo de Kohonen. Ciertas evidencias sugieren que algunas neuronas cerebrales se organizan en zonas, de
manera que las informaciones recibidas de los órganos sensoriales se representan internamente en forma de
mapas topológicos, según un cierto aprendizaje. El Modelo de Kohonen pertenece al grupo de algoritmos de
codificación del vector. El modelo genera un mapa topológico para ubicar de manera óptima, un número fijo
de vectores en un espacio de entrada de mayor dimensión, y así facilitar la compresión de datos (Haykin,
1994). La derivación de este modelo presenta dos variantes: el Mapa Auto-organizativo (SOM – SelfOrganizing Map) y el Learning Vector Quantization (LVQ). Ambas variantes se basan en el principio de
formación de mapas topológicos para establecer características comunes entre los vectores (informaciones) de
entrada a la red. Difieren en las dimensiones de los vectores de entrada, siendo multidimensional en el caso de
SOM y unidimensional en LVQ (Hilera y Martínez, 1995). LVQ es una técnica de aprendizaje supervisado,
que explota la estructura esencial del vector de entrada a los fines de la compresión de datos. Un espacio de
entrada se divide en un número de regiones distintas, y se define un vector reproducción para cada región.
Cuando se presenta un nuevo vector de entrada, se determina a qué región pertenece y se lo representa por el
vector reproducción de esa región, obteniendo un considerable ahorro de almacenamiento (Haykin, 1994). La
arquitectura de la red LVQ presenta dos capas con N neuronas de entrada y M de salida. Cada una de las N
neuronas de entrada se conecta a las M de salida hacia delante (feedforward). Entre las neuronas de la capa de
salida, existen conexiones laterales de inhibición (peso negativo). El valor que se asigne a los pesos de las
conexiones feedforward entre las capas de entrada y salida durante el proceso de aprendizaje de la red, va a
depender de esta interacción lateral. El aprendizaje es de tipo competitivo. Las neuronas de la salida compiten
UNIVERSIDAD NACIONAL DEL NORDESTE
Comunicaciones Científicas y Tecnológicas 2000
por activarse y sólo una de ellas permanece activa ante una determinada información de entrada a la red. Esta
neurona se denomina prevalente o vencedora, y en función de ella se ajustan los pesos de las conexiones
(Hilera y Martinez, 1995).
En trabajos previos hemos utilizado MLP para filtrado adaptivo de bioseñales (Lovatto y Monzón, 1996), para
la clasificación de patrones del ritmo cardíaco (Lovatto y Monzón, 1997) y para la identificación de
contracciones ventriculares anormales (Lovatto y Monzón, 1998a y 1998b; Kleisinger y col., 2000). El
objetivo del presente trabajo es presentar la topología LVQ de red neuronal, y comparar su desempeño con
MLP en la detección de arrtimias ventriculares.
MATERIALES Y METODOS
Hardware. Procesador Intel Pentium I de 166 MHz, 32 Mb de RAM, bajo sistema operativo Windows'95.
Señales electrocardiográficas. De la base de datos de arrtimias cardíacas del MIT-BIH (1999), se ha
seleccionado el registro 106 como patrón de entrenamiento y los registros 105, 119 y 200, que presentan un
adecuada variedad de arritmias ventriculares, bajo la forma de PVC (Premature Ventricular Contraction)
(Moody, 1997).
Redes neuronales. La Figura 1 muestra la topología de la red MLP: 8 nodos en la capa de entrada, 4 en la
capa oculta y uno en la capa de salida, donde se indica la detección de PVC (0) o de latido normal (1). La
Figura 2 ilustra la arquitectura de red LVQ, que presenta 8 nodos en la capa de entrada y 4 en la de salida. La
neurona vencedora en la capa de salida determinará un latido normal (1), o PVC (2).
Neurona de salida
Neuronas de salida
1
2
3
4
5
6
7
Neuronas de entrada
Figura 1. MLP (Perceptron Multicapa)
8
1
2
3
4
5
6
7
8
Neuronas de entrada
Figura 2. LVQ (Learning Vector Quantization)
Datos de entrenamiento y prueba. Los mismos datos electrocardiográficos alimentan la capa de entrada de
ambas redes y consisten en 6 intervalos RR consecutivos, el promedio de los 10 intervalos RR anteriores y el
ancho del complejo QRS (Hu, 1996). Para la extracción de estos patrones de entrada, se utilizó el algoritmo
de detección de QRS propuesto por Afonso (1993). Este algoritmo, al igual que las RNA, fueron
UNIVERSIDAD NACIONAL DEL NORDESTE
Comunicaciones Científicas y Tecnológicas 2000
implementados con MATLAB (The Mathworks, Natick, Massachusetts) y el Neural Network Toolbox 3.0
(Hanselman y Littlefield, 1995). El registro 106 utilizado para el entrenamiento contiene 520 PVC, sobre un
total de 2027 latidos. Se dividió el registro en tres sub-conjuntos: con dos de ellos se realiza el entrenamiento
y con el restante el proceso de prueba. Se reitera este procedimiento para las tres combinaciones posibles,
según el método indicado por Hu y colaboradores (1994).
Se pretende que las redes clasifiquen los latidos ventriculares en normales y anormales. Estos últimos se
manifiestan antes del tiempo (intervalo RR corto) que correspondería a un latido normal, seguido de un latido
compensatorio (intervalo RR largo).
DISCUSION DE RESULTADOS
En la tabla de la Figura 3 se exponen los resultados del estudio comparativo entre las topologías MLP y LVQ.
Las columnas indican las señales 119, 200 y 105 utilizadas en la prueba y los valores obtenidos para evaluar la
habilidad de ambos detectores: Sensibilidad, S=TP/(TP + FN); Especificidad, E=TN/(TN + FP);
Predictividad Positiva, PP=TP/(TP + FP) y Tasa de Falsos Positivos, TFP=TP/(TP + FN). Los cálculos se
realizan teniendo en cuenta la cantidad de verdaderos y falsos positivos y de verdaderos y falsos negativos,
según la información consignada en cada registro del MIT-BIH y la obtenida en el proceso experimental.
De lo valores expuestos en la Figura 3, surge que el Perceptron Multicapa tiene un mejor desempeño que LVQ
en la detección de arritmias ventriculares en los tres registros electrocardiográficos utilizados.
ECG
RNA
119
S
E
PP
200
TFP
S
E
105
PP
TFP
S
E
PP
TFP
MLP
0.99 0.98 0.94 0.02 0.92 0.98
0.95
0.02
1
0.98
0.59
0.02
LVQ
0.93 0.79 0.78 0.06 0.68 0.97
0.89
0.03
0.96
0.97
0.51
0.03
Figura 3. Cuadro comparativo de MLP y LVQ
CONCLUSIONES
Para mejorar la eficacia del Modelo de Kohonen como detector de arritmias cardíacas, en una segunda etapa
de este trabajo se tiene previsto implementar una combinación de las variantes SOM y LVQ. De esta forma,
como lo indica Haykin (1994), el Mapa Auto-organizativo proveería una aproximación al espacio de entrada
de una manera no supervisada, para luego aplicar la metodología supervisada de LVQ.
BIBLIOGRAFIA
Afonso VX, 1993. ECG QRS Detection. En W.J. Tompkins (editor), Biomedical Digital Signal Processing.
Englewood Cliffs, NJ:Prentice-Hall, 1993.
Baxt W, 1992. The application of the artificial neural network to clinical decision making. Conference on
Neural Information Processing Systems: Natural and Synthetic. Denver, Colorado, USA.
Hanselman D, Littlefield B, 1995. MATLAB User’s Guide. Englewood Cliffs, NJ, Prentice-Hall.
UNIVERSIDAD NACIONAL DEL NORDESTE
Comunicaciones Científicas y Tecnológicas 2000
Harrison RS, Marshall S, Kennedy R, 1991. The early diagnosis of heart attacks: A neurocomputational
approach. International Joint Conference on Neural Networks, Vol. 1, pp. 1-5. Seattle, Washington,
USA.
Haykin S, 1994. Neural networks: a comprehensive foundation. Englewood Cliffs, New Jersey: IEEE Press
Macmillan.
Hilera JR, Martínez VJ, 1995. Redes Neuronales Artificiales: Fundamentos, modelos y aplicaciones.
Madrid, España: RAMA Editorial.
Hu YH, 1996. Pattern Classification with Multiple Classifiers. Dept. of Elect. & Comput. Engineering.
University of Wisconsin-Madison.
Hu YH, Tompkins WJ, Urrusti JL, Afonso VX, 1994. Applications of Artificial Neural Networks for ECG
Signal Detection and Classification. Journal of Electrocardiology, Vol. 26, pp. 66-73. Supplement.
Kleisinger GH, Barbosa L, Monzón JE, 2000. Neural-Network Detection of Abnormal Ventricular Beats
Using Temporal and Morphological Features of the Electrocardiographic Signal. Proceedings of the
Fourth World Multiconference on Systemics, Cybernetics and Informatics. Orlando, Florida, USA.
Lovatto SF, Monzón JE, 1996. Filtrado Adaptivo Digital mediante Redes Neuronales Artificiales. VII
Simposio Latinoamericano de Ingeniería Biomédica. Bucaramanga, Colombia, 9-13 Octubre.
Lovatto SF, Monzón JE, 1997. Clasificación de Patrones del Ritmo Cardíaco con Redes Neuronales
Heteroasociativas. Reunión de Comunicaciones Científicas y Tecnológicas de la Universidad Nacional
del Nordeste. Corrientes, 29 de Septiembre al 3 de Octubre.
Lovatto SF, Monzón JE, 1998a. Análisis del ECG con redes neuronales multicapa para la identificación de
contracciones ventriculares anormales. Reunión de Comunicaciones Científicas y Tecnológicas de la
Universidad Nacional del Nordeste. Resistencia (Chaco), 26 al 30 de octubre.
Lovatto SF, Monzón JE, 1998b. Reconocimiento de Contracciones Ventriculares Prematuras Utilizando
Redes Neuronales de la Clase MLP. Revista Argentina de Bioingeniería, Vol. 4, Nº 2, pp. 23-27.
Marquardt DW, 1963. An algorithm for least-squares estimation of nonlinear parameters. J. SIAM, 11, pp.
431-441.
MIT-BIH, 1999. Massachusetts Institute of Technology-Beth Israel Hospital Database Distribution, MIT, 77
Massachusetts Avenue, Room 20A-113, Cambridge, MA 02139.
Moody GB, 1997. ECG Database Applications Guide, Tenth Edition. Harvard-MIT Division of Health
Sciences. Biomedical Engineering Center.