Download Sistema logístico de previsión on-line, mediante redes neuronales
Document related concepts
Transcript
Investigaciones Europeas de Dirección y Economía de la Empresa VoJ.2,W3,1996,pp.6l-79 SISTEMA LOGISTICO DE PREVISIÓN ON-LINE, MEDIANTE REDES NEURONALES DEL SISTEMA DE DISTRIBUCIÓN DE UNA EMPRESA ELÉCTRICA. De Abajo Martínez, N. ACERALIA Corporación Siderúrgica De la Fuente García, D.; Gómez Gómez, A. Universidad de Oviedo RESUMEN Los estudios de logística ligados al transporte de "unidades de productos", ha generado en los últimos tiempos el desarrollo de numerosos métodos de mejora y optimización de rutas, cargas etc.; en cambio poco se ha desarrollado para los casos de transporte "inmediato", como es el de la distribución eléctrica, no siendo este un problema menor, pues las compañías eléctricas se ven obligadas a sobredimensionar todas sus líneas de distribución en media tensión ante la dificultad de coordinar y optimizar sus procesos de transporte. El objetivo de este trabajo es un sistema de cálculo de previsiones a "muy corto plazo" en minutos y "corto plazo" en horas, mediante redes neuronales artificiales, como elementos de un sistema de gestión logística "on-line" de un sistema de distribución eléctrica de media tensión. El estudio que resume este artículo fue desarrollado para la empresa Hidroeléctrica del Cantábrico, en adelante HC, y la explotación de las previsiones a corto plazo tendrá su primera aplicación en la preparación de descargos de línea (estos son los desenganches de líneas necesarios para la revisión de la misma y en algunos casos su reparación), a efectos de dimensionar las alimentaciones auxiliares necesarias. Posteriormente, la utilización de este sistema permitirá la incorporación de datos previsionales a la selección on-line de posibles escenarios logísticos, o sea la elección de las aperturas y conexiones de los robustos instrumentos que tienen las complejas redes de distribución. Por todo ello y debido a la repercusión en los costes de distribución se necesitan sistemas de previsión rápidos. PALABRAS CLAVES: Rredes neuronales. Previsión. On-line. Distribución. Logística. INTRODUCCIÓN Desde mediados de los años 80, la utilización de las redes neuronales artificiales, en adelante ANN [15], en numerosos problemas industriales, se ha convertido en algo relativamente cotidiano [2], y por eso en general, el sector eléctrico no ha sido ajeno a este movimiento. Las ANN eran, y son en gran medida, algoritmos libremente inspirados en alguno de los modelos biológicos planteados por los fisiólogos para el funcionamiento cerebral, tanto a nivel celular, neuronas, como lobular o de conjunto. A partir de este origen, fueron apareciendo algoritmos que, por derivación de los biológicamente inspirados, presentaban una mayor capacidad de adecuación a los problemas reales, si bien su "traza" neuronal era mucho más discutible. No es objeto de este artículo el desarrollo de una descripción exhaustiva de las ANN, ni una explicación de sus fundamentos matemáticos, si bien parece interesante ofrecer un resumen de los paradigmas más utilizados que puede ser consultado en el ANEXO 1. De Abajo Martinez, N.; De la Fuente Careta, D.; Gáme: Gámez; D. El incremento en la década de los noventa de las conferencias, trabajos de I+D y artículos publicados en las más prestigiosas revistas de investigación etc., sobre las posibles soluciones aportadas por las ANN a los problemas más habituales de la industria eléctrica, permite suponer una implantación de las mismas a corto plazo. Los puntos de investigación mas habituales, abarcan temas ligados a la monotorización, el modelizado, la previsión, etc. por ejemplo, podemos citar como estudios típicos los siguientes: • • • • • • • • Valoración de seguridad en tiempo real. Diagnóstico de fallos. Procesado de señales de alarma: Multiplexado y Fallos reales. Modelizado de máquinas síncronas. Análisis de corrientes parásitas. Despacho económico. Modelizado de centrales nucleares, etc. Previsión de la demanda. [1][4][7][8][10][11][12] [16]. Del análisis de la mayor parte de la información publicada sobre el tema de previsión, se infiere una conclusión clara: las ANN utilizadas en el sector eléctlico suelen estar basadas en los modelos más simples (perceptrones multicapa, Hopfield y SOM) [14] [S] Y [6]. La clave suele estar en las pequeñas aportaciones específicas para cada caso que se está estudiando. Estos "accesorios" para modelos sencillos, permiten agilizar los procesos de implantación, entrenamiento y análisis de la fiabilidad de los resultados. Como hemos dicho el presente estudio se centra en la previsión de demanda; este punto ha sido quizás, el más tratado en los últimos años como demuestra la profusión de publicaciones sobre el tema en las revistas de distribución eléctrica y este auge viene motivado a nuestro juicio por dos factores esenciales [10]: CAPACIDAD:los históricos de las curvas de carga suelen ser fácilmente accesibles, abundantes y recogidos en computadoras. Esto facilita el entrenamiento de las redes y posibilita un gran número de pruebas antes de su instalación. NECESIDAD:desde el punto de vista empresarial estimación de la demanda para: resulta muy interesante conocer la a) Planificación de la generación: evitando costosas cargas económicas originadas por criterios excesivamente conservadores. b) Intercambios energéticos planificados. e) Análisis de seguridad: permitiendo anticiparse a situaciones no deseadas o estimar el mejor momento para los descargos. Los problemas surgen de la complejidad de las muy diversas topologías que presentan las redes de distribución. A medida que las previsiones se intentan llevar aguas abajo, las variaciones son más bruscas y las previsiones se vuelven más complicadas ante cambios prácticamente aleatorios. De ahí que casi todos los estudios realizados hasta la fecha se concreten en términos de previsiones globales o agregados, o sea consideran el conjunto de la red o subestaciones, en el 62 Investigaciones Europeas, Vol. 2, N° 3,1996, pp. 61-79 Sistema logistico de previsión on-line, mediante redes neurona/es del sistema de distribución ... mejor de los casos. En este trabajo se propone una buena categorización de las líneas de media tensión que, apoyada en criterios lógicos, permita minimizar los riesgos intrínsecos a toda estimación. Una característica común a todos los estudios es una abundante utilización de datos climáticos. Por desgracia para este trabajo sólo se ha podido contar con las temperaturas máxima y mínima diaria de las 3 zonas fundamentales cubiertas por la empresa donde se realizó este estudio (HC). El sistema de distribución eléctrica puede estar fuertemente ramificado (altamente mallado) caso frecuente en los grandes núcleos urbanos, lo que dificulta su análisis y la posibilidad de disponer de previsiones "on-line" fiables resulta imprescindible para el mantenimiento del servicio adecuándolo a las limitaciones técnicas de las líneas de media tensión (ver figural). ESTUDIOS PREVIOS A continuación se comentan las fases de desarrollo en tiempo real. En 1995, se comienza una investigación dicho año se realizaron varios estudios encaminados al previsión aplicables en la estimación de la demanda. Esta etapas, como muestra la figura 2. del sistema logístico de distribución para la empresa He, a lo largo de análisis de los diversos métodos de investigación se estructuró en cuatro LA PRIMERA ETAPA, llamada Representación, permitió obtener los datos de los más de 300 puntos telemedidos de la red de He en el periodo Octubre-Diciembre 1994. Se consiguió de esta forma depurar todo el sistema de adquisición de datos, que en algunos casos presentaba problemas de rango, además de familiarizarse con todas las herramientas ya utilizadas en He para el manejo y depurado de las curvas de carga. SECUNDA ETAPA: En ARIMA, metodología de Box-Jenkins [3], se recogen todos los estudios hechos sobre este tema con tres objetivos fundamentales: previsión de perfiles diarios, puntas y medias diarias. Los resultados de los estudios realizados indujeron a incorporar algunas etapas del método ARIMA al trabajo posterior con ANN, pero las herramientas utilizadas por los investigadores demostraron una cierta incapacidad para el trabajo en tiempo real, aunque pensamos que con la actual capacidad de los ordenadores parece una línea de investigación con mucho futuro. Por ello se optó en ese momento por crear una línea de estudios de previsión en líneas de media tensión, llamada PRELIMET, mediante redes neuronales. TERCERA ETAPA: Implementación de PRELIMET, que incorporaba generación, estudios previos, análisis de resultados, y ANN para el tratamiento de curvas de carga por separado. SISTEMA LOGISTICO DE DISTRIBUCIÓN EN TIEMPO REAL Se recuerda que el objetivo final del trabajo, es la implantación de un sistema de previsión para su inclusión en un sistema logística de distribución en tiempo real y para aclarar la descripción del módulo desarrollado, se pasa a dividir en cinco subapartados, a saber: una descripción general, la corrección de errores, la categorización de las líneas, las redes neuronales artificiales y por último la salida. Investigaciones Europeas, Vol. 2, N° 3,1996, pp. 61-79 63 De Abajo Martinez, N.; De la Fuente Garcia, D.; Gómez Gámez, D. Descripción A partir de las mediciones de intensidad realizadas en cada uno de los puntos de la red, se genera una serie temporal con la que se trabaja tanto por métodos estadísticos clásicos (Autocorrelaciones, Box-Cox, etc.) como por métodos menos convencionales (ANN), para ofrecer una estimación del valor que tomará la serie en la próxima hora (previsiones "a muy corto plazo"). Mediante el cálculo de previsiones sucesivas se consigue que el horizonte previsional puede pasar a ser a "corto plazo" lo que permite la planificación de descargos con algunos días de antelación. La mejor forma de entender este método de previsión es a través del esquema de bloques de la figura 3, donde cada bloque representa un submódulo que iremos comentando en subapartados posteriores. El bloque 0, es un bloque de transmisión de datos desde una "workstation ordenador personal. HP" a un Bloque 1: correción de errores Se entiende por corrección de errores la depuración de la serie temporal compuesta por el histórico de intensidades medidas en algún punto de la línea. Al realizar una telemedida siempre cabe la posibilidad de que el medio físico de transmisión introduzca errores o medidas mal tomadas o que la medición sea imposible porque no funcione el software de transmisión, entonces la curva de carga toma en ese momento un valor negativo. Esto permite una fácil identificación de los errores en esta fase del proceso, pero no obstante dos se plantean dos dudas: v" ¿Cuándo una línea queda invalidada por exceso de errores? v" Y en caso de ser válida: ¿qué número se debe de usar para sustituir los valores negativos? . La respuesta a la primera pregunta, se realiza mediante la utilización de unos "entornas" del punto de previsión con diferentes tolerancias como se representa en la figura 4. Lógicamente en cada entorno se aplicará un criterio diferente de invalidación de línea, e incluso de corrección de errores. Así, para el primer entorno no se permiten errores, en el segundo se permite uno que es corregido por interpolación. El motivo de esta exigencia tan fuerte se debe a la importancia del vector formado por las 6 horas previas a la toma de decisiones, como se describirá en el bloque 3. Para el resto de los períodos los criterios de validación escogidos fueron más relajados pero siempre atendiendo a una doble vertiente: 64 v" Porcentaje sobre el volumen total de datos. v" Períodos de error continuo. Investigaciones Europeas, Vol. 2, N° 3, 1996, pp. 61-79 Sistema logistico de previsión O/I-Une, mediante redes neurona/es del sistema de distribución ... La respuesta a la segunda pregunta, es decir, el número que sustituye a los valores negativos se podría decir que depende del tipo de error, pues un error "perseverante" no puede corregirse por mera interpolación entre los valores anterior y posterior al fallo. Exige, cuando menos, una doble interpolación entre los valores del mismo momento del día de la semana precedente y posterior, cuando se disponga de dichas medidas, y sino de dos precedentes, y otro de nivelación con el día en curso. Una vez corregidos los errores, se realiza una media horaria (el trabajo con 6 medidas por hora no resulta demasiado interesante por la sobrecarga que provoca en el tiempo de computación y su escaso valor añadido). Bloque 2: categorización de líneas Se entiende por categorización de líneas de media tensión, la generación de grupos de características similares que permitan agrupar la "población" de líneas conforme a una serie de características. De la capacidad de discriminar depende, en gran medida, la agilidad del proceso por permitir tratamientos comunes para líneas análogas, e incluso su validez por haber una gran diversidad de líneas con comportamientos muy diferentes entre si, pudiendo invalidar los mecanismos de previsión por someterlos a situaciones contradictorias. Para categorizar se proponen dos puntos de vista complementarios: A) el Estadístico y B) el Topológico, que se comentan a continuación: A) ESTADÍSTICO En la identificación de los modelos ARIMA se ejecuta un estudio de las series que analiza las funciones de autocorrelación (ACF) y autocorrelación parcial (PACF), valores que proporcionan información sobre la correlación existente entre un elemento de la serie y sus preceden tes. Apoyándose en la uniformidad de resultados entre los métodos neuronales y los métodos ARIMA [3], se decidió adoptar estos dos índices como elementos de caracterización de la red en caso de detectarse suficiente homogeneidad temporal. La identificación del tipo de función de auto con-elación y de función de autocorrelación parcial de las series, exige tratamientos matemáticos previos de las mismas que persiguen la estacionarización (series estables e invertibles), algo imprescindible para la realización de previsiones. Los métodos típicos son los siguientes: ./ Box-Cox [2]: es un tratamiento que permite la eliminación varianza . de las tendencias en ./ Homogeneización: en este caso se crea una nueva serie a partir de las diferencias entre elementos consecutivos de la misma, lo que elimina las tendencias en media. Una vez aplicados estos métodos a la curva de carga, ésta es importada por alguno de los numerosos programas estadísticos que permiten calcular su ACF y PACF (por ejemplo, SPSS, BMDP, etc.) El análisis de las curvas que ofrecen estos programas (por pura inspección gráfica) permite crear una serie de categorías asociadas a las ACF (en nuestro caso se han Investigaciones Europeas, Vol. 2, N° 3,1996, pp. 61-79 65 De Abajo Martinez; N.; De la Fuente García, D.; Gámet. Gámez; D. elegido tres clases básicas y 4 subclases) y una información más difusa respecto a las PACF (al menos 8 categorías básicas), todo ello para un fondo de unas 50 líneas testeadas. B) TOPOLÓGICO La topología hace referencia a las circunstancias específicas de la línea, marcadas por el tipo de mercado eléctrico al que abastece. Para su clasificación topológica se recurrió al factor experiencia, llegándose a las siguientes categorizaciones: • • • • • Línea urbana: Porcentaje de tendido subterráneo mayor del 70%. Línea rural: Porcentaje de tendido aéreo mayor del 70%. Línea mixta: Si no se verifica ninguna de las dos condiciones anteriores. Línea Alimentadora: Abastece a otras líneas. Línea industrial: Porcentaje de potencia en media tensión contratada respecto a la potencia total, superior al 30%. Entre los dos tipos de clasificación se discriminó la distribución inicial de líneas de media tensión en 5 grupos topológico s y 3 estadísticos que permitieron una mayor homogeneidad en los estudios a realizar en cada caso. Esta categorización se realiza de manera off-line y se puede repetir periódicamente (en grandes plazos -meses-) para mantener actualizado los grupos diseñados. Bloques 3 Y 4: redes neuronales artificiales Son los bloques donde se desarrolla todo el proceso de preparación de los patrones de entrenamiento, así como la descripción de la ANN que se ha seleccionado. Para simular las ANN se seleccionó el paquete SNNS (Stuttgart Neural Network Simulator) v. 4.1 ejecutable bajo LINUX. Esta herramienta se ha elegido por su capacidad de inclusión bajo un módulo único en UNIX, además de la gran cantidad de algoritmos de cálculo y la posibilidad de alterar parámetros, poco accesibles en otros simuladores comerciales, ofreciendo un gran número de posibilidades que van de las realimentaciones de unidades aisladas a la validación cruzada. Dentro de todas estas opciones se optó por la línea más frecuente en los artículos y trabajos revisados sobre el tema y es la simplicidad (la rapidez de cálculo, el tiempo real etc.) en los paradigmas. Por ello se escogió un perceptrón multicapa [14] con algoritmo de aprendizaje: Back-Propagation, capacidad de evolución en el parámetro momento, neuronas con salida Act Login, es decir un paradigma contrastado y utilizado frecuentemente en los estudios de previsión. Al elegir un modelo de ANN tutorado o supervisado (Back-Propagation) debe programarse el aprendizaje de la red, de modo que este sea lo más rápido posible y ajustado al caso en estudio. Para utilizar las redes se debe definir un vector de datos de entrada a la red como se muestra en la figura 5. Dicho vector de entrada en la red se define de la siguiente forma: la carga de la línea en las 6 horas previas, junto con las temperaturas máxima y mínima del día anterior (eliminado en algunos casos por conducimos a errores mayores cuando se sobrepasan determinados rangos). 66 Investigaciones Europeas, Vol. 2, N° 3,1996, pp. 61-79 Sistema logistico de previsión on-line, mediante redes neuronales del sistema de distribución ... En las redes neuronales propuestas, la capa intermedia es variable en función del tipo de línea que se este estudiando. La capa de salida está compuesta por una neurona que proporciona el valor previsto. Uno de los aspectos fundamentales en redes neuronales es la selección de los patrones de entrenamiento, en cuanto a ellos podemos decir que en febrero de 1995, se publicó un trabajo de la universidad de Florida [4], en el que se incluía un algoritmo de aprendizaje incorporado a una metodología de previsión. Dicho algoritmo se basa en la idea del entrenamiento "selectivo" y "continuo", que se ha logrado gracias al incremento de potencia de las computadoras personales. Antes de realizar una previsión siempre es conocido el vector de entrada de la ANN compuesto por los valores de carga y temperatura antes descritos y también es conocida la hora para la que se pretende hacer la previsión. Por ello, teniendo los históricos de carga y temperatura agrupados en el mismo formato, se puede realizar una comparación entre el vector de entrada y los posibles patrones, seleccionándose en cada momento los patrones con el mayor parecido a la entrada (situaciones pasadas más similares a la que se desea prever) (ver figura 6). Para medir la distancia entre el vector de datos y los patrones bastaría calcular la distancia euclídea entre ambos. Con esto se crea un fichero de entrenamiento que contiene aquellos valores que hiciesen mínima esta distancia. Evidentemente, la búsqueda no barre todo el espectro de históricos registrados, por lo que se discrimina el espacio muestral en función de la hora de búsqueda y el tipo de día, según sea: Lunes, Martes-Jueves, Viernes, Sábado, Domingo o Vacaciones. El conjunto de patrones quedará conformado por aquellos vectores que tengan menor distancia al vector de entrada, fijándose un número mínimo de patrones a incluir para asegurar que el entrenamiento es correcto. Este fichero se divide posteriormente en dos: uno de entrenamiento y otro de validación posibilitando así la llamada validación cruzada. Una vez entrenada la ANN, se le propone el vector correspondiente a la previsión y obteniéndose el valor de la misma. Este valor previsto puede ser guardado como histórico virtual de cara a sucesivas previsiones. Bloque 5. Salida La salida debe ser lo más sencilla posible, ofreciendo la posibilidad gráfica y de lectura directa, presentando la evolución prevista contrastada con la registrada en el periodo de condiciones más similares y la del día de la semana equivalente anterior. RESULTADOS Los resultados obtenidos del desarrollo del sistema de previsión on-line, se analizan en dos subapartados, uno correspondiente a una serie de precisiones técnicas con respecto a las ANN utilizadas, y otro donde representamos las tablas de resultados propiamente dichas. Investigaciones Europeas, Vol. 2, N° 3, 1996, pp. 61-79 67 De Abajo Martinez; N.; De la Fuente Garcia, D.; Gómez Gómez, D. Algunas precisiones técnicas sobre las ann utilizadas Como hemos dicho, si bien el objetivo de este artículo no es explicar el funcionamiento de las ANN ni de sus fundamentos matemáticos, sí creemos que deben de incluirse algunos datos técnicos en cuanto a su construcción. Así, se han variado los paradigma s de aprendizaje entre tres posibles: Back-Propagation Standard, Back-Propagation con momento y Quickpropagation. Los parámetros básicos ajustables en ellos son: el de aprendizaje (asociable a la capacidad de alteración de la matriz de pesos en cada entrenamiento), el de momento (capacidad de recuerdo directo de la matriz de pesos del ciclo anterior), el de nivel de ruido (añadido a la derivada de la función de activación, evita mínimos locales en la minimización que realiza el aprendizaje). Otros elementos ajustables son: la presentación aleatoria o no de los patrones de aprendizaje, el número de neuronas de la capa intermedia (en nuestro caso normalmente 13 neuronas), y en cada caso se incluye el número de ciclos de entrenamiento, lo que ofrece una idea aproximada del tiempo de aprendizaje. Tablas Las tablas siguientes contienen a modo de ejemplo 11, 5 Y 4 previsiones y valores reales de tres series realizadas en diferentes líneas (urbana-poco industrial y rural-industrial), con los tres tipos de aprendizaje, el número de ciclos realizado para cada caso así como otra serie de parámetros representati vos de los diferentes tipos de redes empleadas. Para cada línea se ha calculado también los errores absoluto, relativo y el error acumulado para diferentes horas de las previsiones obtenidas. o Primera línea (tablal y 2): Línea urbana(100%) y poco industrial (17,5%). Previsiones realizadas a las 11:00 para el día 35 de 1996 de las 12:00-17:00 Como se puede ver en las tablas 1 y 2, la mejor previsión es la novena para la primera hora, resultado obtenido mediante una ANN back-propagation momenturn (ver características en la tabla 1) y la undécima para el conjunto de previsiones con una ANN quick propagation. o Segunda línea (tabla 3 y 4): Línea urbana(100%) y poco industrial (17,5%). Previsiones realizadas a las 6:00 para el día 87 de 1996 de las 7:00-11:00 Como podemos observar en esta segunda línea, que se diferencia de la primera solamente en los horarios de cálculo de previsiones, los mejores resultados corresponden a la cuarta previsión para la primera hora (tabla 3) y la quinta para las horas agregadas (tabla 4) en ambos casos la ANN es una back-rnomentum. o Tercera línea (tabla 5 y 6): Línea rural( 82%) e industrial (43,7%) Previsiones realizadas a las 21:00 para el día 26 de 1996 de las 22:00-1:00 En el caso de la línea rural, el modelo ANN es back-rnomentum neuronas en la capa oculta y se obtiene en la previsión cuarta. con mayor número de A modo de resumen podemos decir que en las tablas anteriores se muestran algunas de las previsiones obtenidas (las pruebas en realidad han sido con 12 líneas y los resultados obtenidos han sido, en general, satisfactorios). 68 Investigaciones Europeas, Vol. 2, 03,1996, pp. 61-79 Sistema logistico de previsi6n on-line, mediante redes neuronales del sistema de distribucián ... De la observación de las tablas, se puede deducir la importancia del ajuste de los parámetros de la red y las dificultades de algunas franjas horarias donde los saltos cuantitativos son muy importantes (primeras horas de la mañana) y donde los errores son muy notables, imposibilitando un trabajo sistemático, al menos con los históricos de curvas y temperaturas existentes hasta ahora. La zona más importante para las compamas eléctricas es la franja 10:00 a 13:00 (estudiada en las tablas 1,2,3 y 4) por producirse generalmente en ella los picos diarios, lo que obliga a reajustes en algunas zonas de distribución. En estas horas, y en general de 10:00 a 1:00, las previsiones son mucho más fiables (errores del 3%) siendo éstas zonas de trabajo más seguras. El último paso que realiza el sistema logístico de distribución es el que corresponde a los descargos, y que consistiría simplemente en la observación de las previsiones de la línea menos cargada, la cual sería desconectada si fuese necesario. CONCLUSIONES El objetivo del presente trabajo ha sido presentar una metodología para la implantación de un sistema logístico de distribución en tiempo real mediante redes neuronales que consta de diferentes módulos como toma de datos, corrección de errores, la categorización de las líneas, utilización de redes neuronales artificiales y un módulo de salida. El tipo de redes escogido y la metodología de selección de patrones, que calcula la distancia entre el vector de datos en tiempo real y los patrones, permite el cálculo de previsiones on-line mediante la correcta telecarga de datos. Su capacidad de integración en módulos generales es alta al haberse desarrollado en un soporte estándar (Linux), con un software shareware y sobre un hardware de bajo coste (Pentium-100 Mhz) y con un resultados fácilmente transferibles bajo cualquier protocolo de comunicaciones. Los resultados, dispares, muestran la diversidad de las redes que engloban bajo un mismo nombre topología s (y por coherencia: resultados) totalmente diferentes.' NOTAS (1) Agradecimientos. Hidroeléctrica del Cantábrico sin sus datos y apoyo económico el proyecto habría sido irrealizable, y en particular a D. Bautista Rodríguez Sánchez de cuya confianza dependió el proyecto y que colaboró activamente con él, a D. Jose Luis García Villares por compartir abiertamente su experiencia y a D. Pedro García Casielles por su colaboración desde la Universidad. Investigaciones Europeas, Vol. 2, N° 3, 1996, pp. 61-79 69 De Abajo Martlnez, N.; De la Fuente Garcia, D.; Gáme; Gámez, D. ANEXO: ALGUNAS PARTICULARIDADES DE LAS ANN Al. Clasificación general La filosofía genérica de las ANN es la reproducción del esquema cerebral, tanto en sus unidades de proceso (neuronas), como en sus conexiones y modo de establecerlas. En 1943 apareció el primer modelo de neurona artificial gracias a McCulloh y Pitts [9] conocido por neurona formal. En 1986 se concretaron los procedimientos deterministas conocido como "Back-Propagation", modelo de gran vigencia aún hoy en día (Rurnelhart, Hinton y Willians,[RumelhartI986]). Uno de los esquemas de clasificación de ANN más frecuentemente utilizados es el de la figura 7 que se basa en el tipo de datos con los que trabaja: binarios (l/O) o de elementos continuos. De cada uno de ellos surgen tratamientos muy diferentes. Conceptos comunes a ambos son la "supervisión" y la "no supervisión". Los primeros se caracterizan por presentárseles patrones de salida con los que contrastan y corrigen sus resultados. Los segundos no permiten ese contraste y se apoyan en la asociación de características homogéneas. El modelo que se ha utilizado en este artículo ha sido el basado en el Perceptrón Multicapa con paradigma Back-Propagation. A2. Breve Cronología del paradigma Back-propagatíon El Back-Propagation es un eficiente procedimiento recursivo para calcular como variará la salida de un sistema no lineal complejo cuando se varían algunos parámetros internos (p.e, los pesos). Estos parámetros son variados en el sentido en el que disminuye la diferencia entre la salida actual y la deseada. Como el Back-Propagation no requiere ejemplos estocásticos durante el aprendizaje puede ser fácilmente implementado en un ordenador convencional, y ha sido el más popular de los nuevos procedimientos. Durante los últimos años ha sido aplicado a numerosos problemas simulados y reales. Hinton, a finales de los ochenta, revisó algunas de estas aplicaciones y proponiendo ciertas variaciones del procedimiento. El Back-Propagation tiene una larga y compleja historia, se puede decir que es una generalización depurada de la técnica de corrección del error del gradiente de Widrow-Hoff [17]. Fue descrita por Werbos[17], pero su importancia no fue en su momento reconocida, quizás porque no se desarrollaron suficientemente sus posibilidades en la construcción de representaciones internas apropiadas e interesantes. Fue ampliado hacia 1981 por David Rumelhart y David Parquer por separado, pero ninguno publicó artículo alguno en unos años. Por ello, fue mejorado por Le Cun en 1986. Una de las razones por las que Rumelhart inicialmente no investigó más profundamente el Back-Propagation es que, como en todos los procedimientos del gradiente, puede quedarse bloqueado en un mínimo local. Un importante resultado de la experiencia es que esto no suele generar grandes problemas, sino que el tiempo de convergencia es, a menudo, una limitación más severa, especialmente para aplicaciones largas. En realidad este procedimiento puede ser 70 Investigaciones Europeas, Vol. 2, N" 3,1996, pp. 61-79 Sistema logistico de previsión on-line, mediante redes neuronales del sistema de distribución ... aplicado a cualquier sistema compuesto de módulos interactivos que obedezcan a las siguientes reglas de diseño: ./ Las derivadas de las salidas de un módulo con respecto a las entradas que recibe de otros módulos deben ser limitadas y calculables de modo eficiente . ./ Algunos módulos deben tener parámetros internos, y las derivadas de las salidas con respecto a estos parámetros deben ser limitadas y calculables de forma eficiente. A3. Descripción de paradigma Back-propagation. Las redes neuronales (o redes de neuronas artificiales), son modelos matemáticos simplificados de las redes de neuronas que constituyen el cerebro humano. Estos modelos, están compuestas por un conjunto de "neuronas artificiales" o conjunto de unidades que procesan e intercambian información. Las neuronas de una red, están estructuradas en distintas capas, de forma que una neurona de una capa está conectada con las de la capa siguiente, a las que puede enviar información. Tal como se refleja en la figura 5, la arquitectura más habitual consiste en una capa de neuronas de entrada que recibe la información "del exterior", una serie de capas intermedias (u "ocultas") y una capa de salidas, que proporciona "al exterior" el resultado del trabajo de la red. Cada neurona, tal como se muestra en la figura 8, constituye una "unidad de procesamiento" de información, convierte un conjunto de señales de entrada en una salida que es difundida a las neuronas de la capa siguiente. Esta conversión se realiza en dos etapas: primero, cada una de las señales de entrada es multiplicada por un coeficiente de ponderación ("peso sináptico") atribuido a la conexión; todos los productos son sumados para obtener una cantidad denominada "entrada ponderada total". En una segunda fase, cada unidad utiliza una función de transferencia entrada-salida, o función de activación, que transforma la entrada ponderada total en una señal de salida que es la que se difunde a las neuronas de la capa siguiente. La función de transferencia puede ser de tres tipos (Lippmann, 1987): 1.- Lineal. La actividad de salida es proporcional a la entrada ponderada total. 2.- De umbral. La salida queda fija a uno de dos niveles, dependiendo si la entrada ponderada total es mayor o menor que cierto valor crítico denominado "umbral". 3.- Sigmoide. La salida varía de forma continua dependiendo de la entrada ponderada total, pero esta dependencia no es lineal. Habitualmente, se suele utilizar la sigmoide como función de transferencia cuando se trata de aplicar la tecnología de redes neuronales al procesado de señales no-lineales (Lapedes y Farber, 1987), aunque es necesario tener presente que las tres son aproximaciones bastante burdas de la actividad de las neuronas reales. El proceso de aplicación de estas redes neuronales a un problema concreto, consta de tres etapas fundamentales: Investigaciones Europeas, Vol. 2, N° 3,1996, pp. 61-79 71 De Abajo Marttnez, N.; De la Fuente García, D.; Gámez Gomez, D. 1.- Diseño de la Red. Es necesario decidir la arquitectura que va a tener la red, lo cual implica determinar el número de neuronas de la capa de entradas, el número de capas ocultas y las neuronas que contendrá cada una de ellas y por último, el número de neuronas de la capa de salidas. La arquitectura de la red dependerá como es lógico, del problema concreto que se quiera resolver. 2.- Entrenamiento de la Red Neuronal Artificial. El entrenamiento de una Red Neuronal es la utilización de un algoritmo para ajustar los pesos sinápticos de las conexiones entre las neuronas. El proceso consiste en presentar a la red inicial una batería de casos de entrenamiento, que se construyen utilizando los datos reales disponibles (el pasado de la serie temporal). Cada uno de estos casos está compuesto por una serie de valores de entrada y el valor de salida correspondiente. Se asignan los valores de entrada a las neuronas de la capa de entradas, y se obtiene al final un valor de salida de la red neuronal. Esta respuesta se compara con la deseada u objetivo, mediante una función de error que da una medida de la eficacia de la configuración actual de pesos sinápticos de la red. El objetivo del aprendizaje es minimizar esta función de error. Esto es así en el caso de las ANN supervisadas. 3.- Utilización de la Red Neuronal en "Modo Recuerdo". Una vez entrenada, la Red Neuronal está en condiciones de ser utilizada. Para ello, no hay más que presentar a la red un caso determinado (por ejemplo los últimos datos disponibles de una serie temporal) para que, utilizando los pesos sinápticos encontrados durante el proceso de entrenamiento, calcule la salida (la previsión del dato siguiente de la serie temporal). 72 Investigaciones Europeas, Vol. 2, N° 3,1996, pp. 61-79 Sistema logistico de previsión on-line, mediante redes neuronales del sistema de distribución ... BIBLIOGRAFÍA [1) [2) [3) [4] [5) [6) [7) [8) [9) [10) [11) [12) (14) [15) (16) [17) [18) DILLON et al. (1991) Short term load forecasting using an adaptive neural network. Electric Power & Energy Systems. Vol 13 Agosto pags 186-194. BOX, G.E.P. y COX D.R. (1964) An analisis ot transformations ,Journal of the Royal Statistical Society, B, 8, pags 27-41. BOX, G.E.P. y JENKINS G.M. (1976) Time series Analysis Forecasting and control. Holden Day, segunda edición. HO, S. y HSU, D. (1992) Short term load forecasting using an artificial neural network with an adaptative learning algorithm. Transactions on Power Systems. Vol. 7 Febrero pags 141-149. HOPF1ELD, IJ. (1982) Neural and physical Systems. Proceeding National Academic of Science. USA. KOHONEN ,T. (1984) Self-Organization and Associative Memory. Springer-Verlag, LEE, K.Y. Y CHA, Y.T. (1992) Short tenn load forecasting using an artificial neural network. Transactions on Power Systems. Vol7 Febrero pags 124-132 LIEW, K. y CHANG. T. (1994) A neural network short-term load forecaster. Electric Power Systems Research. Pags: 34-57. MCCULLOCH, W.S. y PITIS W. (1943) A logical calculus of the ideas inmanent in nervous activity. Bulletin of Mathematical Biophysics, 9 127-147. MOHAMED, O. et al. (1995) Practical experiences with an Adaptive Neural Network Short-Terrn Load Forecasting Systems. IEEE Transactions on Power Systems. Febrero. 110-131. PARK, M. Y EL-SHARKAWI. A. (1991) Electric load forecasting using an artificial neural network. IEEE Transactions on Power Systems Vol 6 Mayo pag 442-449. PENG, K. (1992) Advancement in the application of neural networks for short term load forecasting. Transactions on Power Systems. Pago 23-41. RUMELHART, D.E. et. al. (1986) Learning internal representations by error propagation, P.D.P. pags 318-362. VANKAYALA V.S., y RAO N.D. (1993) Artificial neural networks and their applications to power systems. V.S .. Electric Power Systems Research. 28 pag 67-79. VILLARES J.L. el. al. (1996) A neural network based hourly electric load forecasting system. Documento de trabajo. WERBOS, P.J. (1974): Beyond regresion: New tools for prediction and analysis in the behavioral sciences. Master Thesis. Harvard University. WIDROW, B. y HOFF M.E. (1960) Adaptative switching circuits Ire Wescon Conv. Record, 4: 96-104 Investigaciones Europeas, Vol. 2, N" 3, 1996, pp. 61-79 73 De Ahajo Martinez; N.; De la Fuente Carda, D.; Gáme: Gámez; D. ANEXO FIGURA 1: ESQUEMA DE INTERCONEXIÓN DE PUNTOS DEONSUMO [TOPOLOGÍA] o Ipunto de consumo/adaptación ILínea subterránea de media tensión FIGURA 2: CRONOLOGÍA Representación DE ESTUDIOS PREVIOS I IARIMA I IPRELIME I Recogida y Análisis de documentación FIGURA 3: DESCRIPCIÓN DEL SISTEMA LOGÍSTICO DE DISTRIBUCIÓN EN TIEMPO REAL Bloque O TRANSMISOR HP=>PC Bloque 1: - Bloque 3: CORRECTOR de ERRORES ----------. PREPARACION 1 de PATRONES Bloque 5 Bloque 4 ~ PREVISION - SALIDA ANN Bloque 2: CATEGORlZADOR de LÍNEAS 74 Investigaciones Europeas, Vol. 2, N° 3,1996, pp. 61-79 Sistema logistico de previsión on-line, mediante redes neurona/es del sistema de distribución FIGURA 4: ENTORNOS TEMPORALES Segundo entorno: 6 hora", (36 medidas) ... PARA EL ESTUDIO DE ERRORES previas al punto de previsión Primer entorno: 1 hora (6 medidas) previas al punto de previsión Tercer entorno: 24 horas previas al punto de previsión Cuarto entorno: 1 semana previa al pumo de previsión Quinto entoroo: 4 semanas previa" al punto de previsión FIGURA 5: ESTRUCTURA GENERAL DE LA ANN UTILIZADA Capa Intermedia: número variable de neuronas FIGURA 6: SELECCIÓN DE PATRONES DE ENTRENAMIENTO SEMEJANZA CON EL VECTOR DE ENTRADA ,. .. .. POR Vector formado por el conjunto de datos de las horas previas a la previsión y las temperaturas .... ...... / .> .¿~~------~ Investigaciones Posible patrón de entrenamiento formado por el conjunto de datos de carga tomados de los históricos y las temperaturas correspondientes. Se tomaran aquellos que más se parezcan al vector Europeas, Vol. 2, N° 3, 1996, pp. 61-79 75 De Abajo Maninez; N; De la Fuente García, D.; Gáme; Gómez, D. FIGURA 7: CLASIFICACIÓN DE LAS ANN. Entrada Continua --------------Supervisada Perceptron No Supervisada I Perceptron Multicapa Mapas de Kohonen --------------Entrada Binaria Supervisada No Supervisada ~ I Red Hopfield Red Harnming Clasificador de Carpenter&Grossberg (ARTl) TABLAl: LÍNEA URBANA. HORA DATOS REALES Prev 1: Back standard Aprendizaje: 0.2 Prev2: Back standard Aprendizaje: 0.3 Prev3: Back momentum: Aprendizaje: 0.2 Ciclos: 15000 Prev4: Back momentum: Aprendizaje: 0.2 Ciclos: 20000 Prev5: Back momentum: Aprendizaje: 0.1 Ciclos: 10000 Prev6: Back momentum: Aprendizaje: 0.1 Ciclos: 20000 Prev7: Back momentum: Aprendizaje: 0.5 Ciclos: 10000 76 12:00 0.678 0.702 13:00 0.677 0.717 14:00 0.701 0.721 15:00 0.721 0.710 16:00 0.691 0.705 17:00 0.692 0.705 0.704 0.733 0.733 0.706 0.694 0.697 0.1 0.705 0.720 0.711 0.683 0.671 0.672 0.1 0.705 0.727 0.725 0.701 0.691 0.692 O.l 0.702 0.705 0.693 0.682 0.681 0.680 0.1 0.701 0.692 0.660 0.615 0.599 0.593 0.1 0.699 0.718 0.720 0.706 0.701 0.701 Investigaciones Europeas, Vol. 2, N° 3, 1996, pp. 61-79 Sistema logistico de previsión. on-line, mediante redes neuronales del sistema de distribución HORA DATOS REALES Prev8: Back momentum: 0.2 Aprendizaje: 0.1 Nivel de ruido: 0.1 Ciclos: 7500 Prev9: Back momentum: 0.2 Aprendizaje: 0.1 Nivel de ruido: 0.3 Ciclos: 5500 Prev 10:Quick.Propagation Aprendizaje: 0.2 Cambio máximo:0.1 Contracción pesos: 0.0001 Ciclos: 8500 Prev 11:Quick.Propagation Aprendizaje: 0.2 Cambio máximo:0.3 Contracción pesos: 0.0001 Ciclos: 8500 12:00 0.678 0.702 13:00 0.677 0.707 14:00 0.701 0.697 15:00 0.721 0.674 16:00 0.691 0.665 17:00 0.692 0.662 0.698 0.713 0.715 0.693 0.681 0.680 0.702 0.724 0.721 0.689 0.676 0.674 0.702 0.713 0.714 0.702 0.695 0.695 ... TABLA 2: MEDIDAS DE ERROR: ERROR EN LAS HORAS DE PREVISION SERIE ERROR ABSOLUTO EN LA PRIMERA HORA ERROR RELATIVO EN LA PRIMERA HORA(%) n 1/ n· I. (xreal - XJ2 J PREV1 PREV2 PREV3 PREV4 PREV5 PREV6 PREV7 PREV8 PREV9 PREVIO PREVII 0.024 0.026 0.027 0.027 0.024 0.023 0.021 0.024 0.020 0.024 0.024 Investigaciones 3.54 3.83 3.98 3.98 3.54 3.39 3.10 3.54 2.95 3.54 3.54 Europeas, Vol. 2, N° 3, 1996, pp. 61-79 0.055 0.071 0.070 0.065 0.056 0.179 0.054 0.073 0.054 0.069 0.049 77 De Abajo Martinez; N.; De la Fuente García, D.; Gáme; Gámez; D. TABLA 3: LÍNEA URBANA. HORA DATOS REALES Prevl: Back momentum: 0.2 Aprendizaje: 0.1 Ciclos: 10000 Prev2: Back momentum: 0.2 Aprendizaje: 0.05 Ciclos: 10000 Prev3: Back momentum: 0.1 Aprendizaje: 0.05 Ciclos: 10000 Prev4: Back momentum: 0.05 Aprendizaje: 0.05 Ciclos: 10000 Prev5: Back momentum: 0.05 Aprendizaje: 0.05 Ciclos: 10000 Sin aleatoriedad entre patrones 7:00 0.334 0.277 8:00 0.446 0.427 9:00 0.515 0.549 10:00 0.599 0.612 11:00 0.617 0.670 0.277 0.425 0.545 0.609 0.667 0.280 0.409 0.542 0.597 0.659 0.289 0.404 0.550 0.606 0.663 0.288 0.409 0.546 0.602 0.662 TABLA 4: MEDIDAS DE ERROR: SERIE PREVl PREV2 PREV3 PREV4 PREV5 ERROR ABSOLUTO EN LA ERROR RELATIVO EN LA PRIMERA HORA(%) PRIMERA HORA 17.01 0.057 17.01 0.057 0.054 16.17 13.47 0.045 13.77 0.046 ERROR EN LAS HORAS DE PREVISION 0.088 0.085 0.082 0.085 0.080 TABLA 5: LÍNEA RURAL E INDUSTRIAL. HORA DATOS REALES Prev1: Back momentum: 0.05 Aprendizaje: 0.05 Nivel de ruido: 0.1 Ciclos: 17500 Prev2: Back momentum: 0.2 Aprendizaje: 0.05 Nivel de ruido: 0.1 Ciclos: 17500 Prev3: Back momentum: 0.01 Aprendizaje: 0.005 Nivel de ruido: 0.1 Ciclos: 17500 78 22:00 0.522 0.487 23:00 0.442 0.455 00:00 0.370 0.384 01:00 0.321 0.312 0.494 0.444 0.390 0.337 0.490 0.461 0.397 0.330 Investigaciones Europeas, Vol. 2, N° 3,1996, pp. 61-79 Sistema logistico de previsión on-line, mediante redes neurona/es del sistema de distribución HORA DATOS REALES Prev4: Back momentum: 0.01 Aprendizaje: 0.005 20 neuronas de capa intermedia Ciclos: 6000 22:00 0.522 0.504 23:00 0.442 0.446 00:00 0.370 0.395 ... 01:00 0.321 0.337 TABLA 6: MEDIDAS DE ERROR: SERIE PREVl PREV2 PREV3 PREV4 Investigaciones ERROR ABSOLUTO EN LA PRIMERA HORA 0.035 0.028 0.032 0.018 Europeas, Vol. 2, N° 3,1996, ERROR RELATIVO EN LA PRIMERA HORA(%) 6.7 5.36 6.13 3.4 pp. 61-79 ERROR EN LAS HORAS DE PREVISION 0.041 0.038 0.047 0.035 79