Download Sistema logístico de previsión on-line, mediante redes neuronales

Document related concepts

Red neuronal artificial wikipedia , lookup

Perceptrón wikipedia , lookup

Red neuronal prealimentada wikipedia , lookup

Propagación hacia atrás wikipedia , lookup

Perceptrón multicapa wikipedia , lookup

Transcript
Investigaciones Europeas de Dirección
y
Economía de la Empresa
VoJ.2,W3,1996,pp.6l-79
SISTEMA LOGISTICO DE PREVISIÓN ON-LINE, MEDIANTE
REDES NEURONALES DEL SISTEMA DE DISTRIBUCIÓN DE UNA
EMPRESA ELÉCTRICA.
De Abajo Martínez, N.
ACERALIA Corporación Siderúrgica
De la Fuente García, D.; Gómez Gómez, A.
Universidad de Oviedo
RESUMEN
Los estudios de logística ligados al transporte de "unidades de productos", ha generado en
los últimos tiempos el desarrollo de numerosos métodos de mejora y optimización de rutas, cargas
etc.; en cambio poco se ha desarrollado para los casos de transporte "inmediato", como es el de la
distribución eléctrica, no siendo este un problema menor, pues las compañías eléctricas se ven
obligadas a sobredimensionar todas sus líneas de distribución en media tensión ante la dificultad de
coordinar y optimizar sus procesos de transporte. El objetivo de este trabajo es un sistema de
cálculo de previsiones a "muy corto plazo" en minutos y "corto plazo" en horas, mediante redes
neuronales artificiales, como elementos de un sistema de gestión logística "on-line" de un sistema
de distribución eléctrica de media tensión.
El estudio que resume este artículo fue desarrollado para la empresa Hidroeléctrica del
Cantábrico, en adelante HC, y la explotación de las previsiones a corto plazo tendrá su primera
aplicación en la preparación de descargos de línea (estos son los desenganches de líneas necesarios
para la revisión de la misma y en algunos casos su reparación), a efectos de dimensionar las
alimentaciones auxiliares necesarias. Posteriormente, la utilización de este sistema permitirá la
incorporación de datos previsionales a la selección on-line de posibles escenarios logísticos, o sea
la elección de las aperturas y conexiones de los robustos instrumentos que tienen las complejas
redes de distribución.
Por todo ello y debido a la repercusión en los costes de distribución se
necesitan sistemas de previsión rápidos.
PALABRAS
CLAVES:
Rredes neuronales. Previsión. On-line. Distribución.
Logística.
INTRODUCCIÓN
Desde mediados de los años 80, la utilización de las redes neuronales artificiales, en
adelante ANN [15], en numerosos problemas industriales, se ha convertido en algo
relativamente cotidiano [2], y por eso en general, el sector eléctrico no ha sido ajeno a este
movimiento. Las ANN eran, y son en gran medida, algoritmos libremente inspirados en alguno
de los modelos biológicos planteados por los fisiólogos para el funcionamiento cerebral, tanto a
nivel celular, neuronas, como lobular o de conjunto. A partir de este origen, fueron apareciendo
algoritmos que, por derivación de los biológicamente inspirados, presentaban una mayor
capacidad de adecuación a los problemas reales, si bien su "traza" neuronal era mucho más
discutible.
No es objeto de este artículo el desarrollo de una descripción exhaustiva de las ANN, ni
una explicación de sus fundamentos matemáticos, si bien parece interesante ofrecer un
resumen de los paradigmas más utilizados que puede ser consultado en el ANEXO 1.
De Abajo Martinez, N.; De la Fuente Careta, D.; Gáme: Gámez; D.
El incremento en la década de los noventa de las conferencias, trabajos de I+D y
artículos publicados en las más prestigiosas revistas de investigación etc., sobre las posibles
soluciones aportadas por las ANN a los problemas más habituales de la industria eléctrica,
permite suponer una implantación de las mismas a corto plazo. Los puntos de investigación
mas habituales, abarcan temas ligados a la monotorización, el modelizado, la previsión, etc. por
ejemplo, podemos citar como estudios típicos los siguientes:
•
•
•
•
•
•
•
•
Valoración de seguridad en tiempo real.
Diagnóstico de fallos.
Procesado de señales de alarma: Multiplexado y Fallos reales.
Modelizado de máquinas síncronas.
Análisis de corrientes parásitas.
Despacho económico.
Modelizado de centrales nucleares, etc.
Previsión de la demanda. [1][4][7][8][10][11][12] [16].
Del análisis de la mayor parte de la información publicada sobre el tema de previsión, se
infiere una conclusión clara: las ANN utilizadas en el sector eléctlico suelen estar basadas en
los modelos más simples (perceptrones multicapa, Hopfield y SOM) [14] [S] Y [6]. La clave
suele estar en las pequeñas aportaciones específicas para cada caso que se está estudiando.
Estos "accesorios" para modelos sencillos, permiten agilizar los procesos de implantación,
entrenamiento y análisis de la fiabilidad de los resultados.
Como hemos dicho el presente estudio se centra en la previsión de demanda; este punto
ha sido quizás, el más tratado en los últimos años como demuestra la profusión de
publicaciones sobre el tema en las revistas de distribución eléctrica y este auge viene motivado
a nuestro juicio por dos factores esenciales [10]:
CAPACIDAD:los históricos de las curvas de carga suelen ser fácilmente accesibles,
abundantes y recogidos en computadoras. Esto facilita el entrenamiento de las redes y
posibilita un gran número de pruebas antes de su instalación.
NECESIDAD:desde el punto de vista empresarial
estimación de la demanda para:
resulta muy interesante conocer la
a) Planificación de la generación: evitando costosas cargas económicas originadas por
criterios excesivamente conservadores.
b) Intercambios energéticos planificados.
e) Análisis de seguridad: permitiendo anticiparse a situaciones no deseadas o estimar el
mejor momento para los descargos.
Los problemas surgen de la complejidad de las muy diversas topologías que presentan
las redes de distribución. A medida que las previsiones se intentan llevar aguas abajo, las
variaciones son más bruscas y las previsiones se vuelven más complicadas ante cambios
prácticamente aleatorios.
De ahí que casi todos los estudios realizados hasta la fecha se concreten en términos de
previsiones globales o agregados, o sea consideran el conjunto de la red o subestaciones, en el
62
Investigaciones
Europeas, Vol. 2, N° 3,1996, pp. 61-79
Sistema logistico de previsión on-line, mediante redes neurona/es del sistema de distribución
...
mejor de los casos. En este trabajo se propone una buena categorización de las líneas de media
tensión que, apoyada en criterios lógicos, permita minimizar los riesgos intrínsecos a toda
estimación.
Una característica común a todos los estudios es una abundante utilización de datos
climáticos. Por desgracia para este trabajo sólo se ha podido contar con las temperaturas
máxima y mínima diaria de las 3 zonas fundamentales cubiertas por la empresa donde se
realizó este estudio (HC). El sistema de distribución eléctrica puede estar fuertemente
ramificado (altamente mallado) caso frecuente en los grandes núcleos urbanos, lo que dificulta
su análisis y la posibilidad de disponer de previsiones "on-line" fiables resulta imprescindible
para el mantenimiento del servicio adecuándolo a las limitaciones técnicas de las líneas de
media tensión (ver figural).
ESTUDIOS PREVIOS
A continuación se comentan las fases de desarrollo
en tiempo real. En 1995, se comienza una investigación
dicho año se realizaron varios estudios encaminados al
previsión aplicables en la estimación de la demanda. Esta
etapas, como muestra la figura 2.
del sistema logístico de distribución
para la empresa He, a lo largo de
análisis de los diversos métodos de
investigación se estructuró en cuatro
LA PRIMERA ETAPA, llamada Representación, permitió obtener los datos de los más de
300 puntos telemedidos de la red de He en el periodo Octubre-Diciembre 1994. Se consiguió
de esta forma depurar todo el sistema de adquisición de datos, que en algunos casos presentaba
problemas de rango, además de familiarizarse con todas las herramientas ya utilizadas en He
para el manejo y depurado de las curvas de carga.
SECUNDA ETAPA: En ARIMA, metodología de Box-Jenkins [3], se recogen todos los
estudios hechos sobre este tema con tres objetivos fundamentales: previsión de perfiles diarios,
puntas y medias diarias. Los resultados de los estudios realizados indujeron a incorporar
algunas etapas del método ARIMA al trabajo posterior con ANN, pero las herramientas
utilizadas por los investigadores demostraron una cierta incapacidad para el trabajo en tiempo
real, aunque pensamos que con la actual capacidad de los ordenadores parece una línea de
investigación con mucho futuro. Por ello se optó en ese momento por crear una línea de
estudios de previsión en líneas de media tensión, llamada PRELIMET, mediante redes
neuronales.
TERCERA ETAPA: Implementación de PRELIMET, que incorporaba generación, estudios
previos, análisis de resultados, y ANN para el tratamiento de curvas de carga por separado.
SISTEMA LOGISTICO DE DISTRIBUCIÓN
EN TIEMPO REAL
Se recuerda que el objetivo final del trabajo, es la implantación de un sistema de
previsión para su inclusión en un sistema logística de distribución en tiempo real y para aclarar
la descripción del módulo desarrollado, se pasa a dividir en cinco subapartados, a saber: una
descripción general, la corrección de errores, la categorización de las líneas, las redes
neuronales artificiales y por último la salida.
Investigaciones
Europeas, Vol. 2, N° 3,1996,
pp. 61-79
63
De Abajo Martinez, N.; De la Fuente Garcia, D.; Gómez Gámez, D.
Descripción
A partir de las mediciones de intensidad realizadas en cada uno de los puntos de la red,
se genera una serie temporal con la que se trabaja tanto por métodos estadísticos clásicos
(Autocorrelaciones, Box-Cox, etc.) como por métodos menos convencionales (ANN), para
ofrecer una estimación del valor que tomará la serie en la próxima hora (previsiones "a muy
corto plazo").
Mediante el cálculo de previsiones sucesivas se consigue que el horizonte previsional
puede pasar a ser a "corto plazo" lo que permite la planificación de descargos con algunos días
de antelación. La mejor forma de entender este método de previsión es a través del esquema de
bloques de la figura 3, donde cada bloque representa un submódulo que iremos comentando en
subapartados posteriores.
El bloque 0, es un bloque de transmisión de datos desde una "workstation
ordenador personal.
HP" a un
Bloque 1: correción de errores
Se entiende por corrección de errores la depuración de la serie temporal compuesta por
el histórico de intensidades medidas en algún punto de la línea.
Al realizar una telemedida siempre cabe la posibilidad de que el medio físico de
transmisión introduzca errores o medidas mal tomadas o que la medición sea imposible porque
no funcione el software de transmisión, entonces la curva de carga toma en ese momento un
valor negativo. Esto permite una fácil identificación de los errores en esta fase del proceso,
pero no obstante dos se plantean dos dudas:
v"
¿Cuándo una línea queda invalidada por exceso de errores?
v"
Y en caso de ser válida: ¿qué número se debe de usar para sustituir los valores
negativos? .
La respuesta a la primera pregunta, se realiza mediante la utilización de unos "entornas"
del punto de previsión con diferentes tolerancias como se representa en la figura 4.
Lógicamente en cada entorno se aplicará un criterio diferente de invalidación de línea, e
incluso de corrección de errores. Así, para el primer entorno no se permiten errores, en el
segundo se permite uno que es corregido por interpolación. El motivo de esta exigencia tan
fuerte se debe a la importancia del vector formado por las 6 horas previas a la toma de
decisiones, como se describirá en el bloque 3.
Para el resto de los períodos los criterios de validación escogidos fueron más relajados
pero siempre atendiendo a una doble vertiente:
64
v"
Porcentaje sobre el volumen total de datos.
v"
Períodos de error continuo.
Investigaciones Europeas, Vol. 2, N° 3, 1996, pp. 61-79
Sistema logistico de previsión O/I-Une, mediante redes neurona/es del sistema de distribución
...
La respuesta a la segunda pregunta, es decir, el número que sustituye a los valores
negativos se podría decir que depende del tipo de error, pues un error "perseverante" no puede
corregirse por mera interpolación entre los valores anterior y posterior al fallo. Exige, cuando
menos, una doble interpolación entre los valores del mismo momento del día de la semana
precedente y posterior, cuando se disponga de dichas medidas, y sino de dos precedentes, y
otro de nivelación con el día en curso.
Una vez corregidos los errores, se realiza una media horaria (el trabajo con 6 medidas
por hora no resulta demasiado interesante por la sobrecarga que provoca en el tiempo de
computación y su escaso valor añadido).
Bloque 2: categorización de líneas
Se entiende por categorización de líneas de media tensión, la generación de grupos de
características similares que permitan agrupar la "población" de líneas conforme a una serie de
características. De la capacidad de discriminar depende, en gran medida, la agilidad del
proceso por permitir tratamientos comunes para líneas análogas, e incluso su validez por haber
una gran diversidad de líneas con comportamientos muy diferentes entre si, pudiendo invalidar
los mecanismos de previsión por someterlos a situaciones contradictorias. Para categorizar se
proponen dos puntos de vista complementarios: A) el Estadístico y B) el Topológico, que se
comentan a continuación:
A) ESTADÍSTICO
En la identificación de los modelos ARIMA se ejecuta un estudio de las series que
analiza las funciones de autocorrelación (ACF) y autocorrelación parcial (PACF), valores que
proporcionan
información
sobre la correlación
existente entre un elemento de la serie y sus
preceden tes.
Apoyándose en la uniformidad de resultados entre los métodos neuronales y los
métodos ARIMA [3], se decidió adoptar estos dos índices como elementos de caracterización
de la red en caso de detectarse suficiente homogeneidad temporal.
La identificación del tipo de función de auto con-elación y de función de autocorrelación
parcial de las series, exige tratamientos matemáticos previos de las mismas que persiguen la
estacionarización (series estables e invertibles), algo imprescindible para la realización de
previsiones. Los métodos típicos son los siguientes:
./
Box-Cox [2]: es un tratamiento que permite la eliminación
varianza .
de las tendencias en
./
Homogeneización: en este caso se crea una nueva serie a partir de las diferencias
entre elementos consecutivos de la misma, lo que elimina las tendencias en media.
Una vez aplicados estos métodos a la curva de carga, ésta es importada por alguno de
los numerosos programas estadísticos que permiten calcular su ACF y PACF (por ejemplo,
SPSS, BMDP, etc.) El análisis de las curvas que ofrecen estos programas (por pura inspección
gráfica) permite crear una serie de categorías asociadas a las ACF (en nuestro caso se han
Investigaciones
Europeas, Vol. 2, N° 3,1996, pp. 61-79
65
De Abajo Martinez; N.; De la Fuente García, D.; Gámet. Gámez; D.
elegido tres clases básicas y 4 subclases) y una información más difusa respecto a las PACF (al
menos 8 categorías básicas), todo ello para un fondo de unas 50 líneas testeadas.
B) TOPOLÓGICO
La topología hace referencia a las circunstancias específicas de la línea, marcadas por el
tipo de mercado eléctrico al que abastece. Para su clasificación topológica se recurrió al factor
experiencia, llegándose a las siguientes categorizaciones:
•
•
•
•
•
Línea urbana: Porcentaje de tendido subterráneo mayor del 70%.
Línea rural: Porcentaje de tendido aéreo mayor del 70%.
Línea mixta: Si no se verifica ninguna de las dos condiciones anteriores.
Línea Alimentadora: Abastece a otras líneas.
Línea industrial: Porcentaje de potencia en media tensión contratada respecto a la potencia
total, superior al 30%.
Entre los dos tipos de clasificación se discriminó la distribución inicial de líneas de
media tensión en 5 grupos topológico s y 3 estadísticos que permitieron una mayor
homogeneidad en los estudios a realizar en cada caso. Esta categorización se realiza de manera
off-line y se puede repetir periódicamente (en grandes plazos -meses-) para mantener
actualizado los grupos diseñados.
Bloques 3 Y 4: redes neuronales artificiales
Son los bloques donde se desarrolla todo el proceso de preparación de los patrones de
entrenamiento, así como la descripción de la ANN que se ha seleccionado.
Para simular las ANN se seleccionó el paquete SNNS (Stuttgart Neural Network
Simulator) v. 4.1 ejecutable bajo LINUX. Esta herramienta se ha elegido por su capacidad de
inclusión bajo un módulo único en UNIX, además de la gran cantidad de algoritmos de cálculo
y la posibilidad de alterar parámetros, poco accesibles en otros simuladores comerciales,
ofreciendo un gran número de posibilidades que van de las realimentaciones de unidades
aisladas a la validación cruzada.
Dentro de todas estas opciones se optó por la línea más frecuente en los artículos y
trabajos revisados sobre el tema y es la simplicidad (la rapidez de cálculo, el tiempo real etc.)
en los paradigmas. Por ello se escogió un perceptrón multicapa [14] con algoritmo de
aprendizaje: Back-Propagation, capacidad de evolución en el parámetro momento, neuronas
con salida Act Login, es decir un paradigma contrastado y utilizado frecuentemente en los
estudios de previsión. Al elegir un modelo de ANN tutorado o supervisado (Back-Propagation)
debe programarse el aprendizaje de la red, de modo que este sea lo más rápido posible y
ajustado al caso en estudio.
Para utilizar las redes se debe definir un vector de datos de entrada a la red como se
muestra en la figura 5. Dicho vector de entrada en la red se define de la siguiente forma: la
carga de la línea en las 6 horas previas, junto con las temperaturas máxima y mínima del día
anterior (eliminado en algunos casos por conducimos a errores mayores cuando se sobrepasan
determinados rangos).
66
Investigaciones
Europeas, Vol. 2, N° 3,1996, pp. 61-79
Sistema logistico de previsión on-line, mediante redes neuronales del sistema de distribución ...
En las redes neuronales propuestas, la capa intermedia es variable en función del tipo de
línea que se este estudiando. La capa de salida está compuesta por una neurona que
proporciona el valor previsto.
Uno de los aspectos fundamentales en redes neuronales es la selección de los patrones
de entrenamiento, en cuanto a ellos podemos decir que en febrero de 1995, se publicó un
trabajo de la universidad de Florida [4], en el que se incluía un algoritmo de aprendizaje
incorporado a una metodología de previsión. Dicho algoritmo se basa en la idea del
entrenamiento "selectivo" y "continuo", que se ha logrado gracias al incremento de potencia de
las computadoras personales.
Antes de realizar una previsión siempre es conocido el vector de entrada de la ANN
compuesto por los valores de carga y temperatura antes descritos y también es conocida la hora
para la que se pretende hacer la previsión.
Por ello, teniendo los históricos de carga y temperatura agrupados en el mismo formato,
se puede realizar una comparación entre el vector de entrada y los posibles patrones,
seleccionándose en cada momento los patrones con el mayor parecido a la entrada (situaciones
pasadas más similares a la que se desea prever) (ver figura 6).
Para medir la distancia entre el vector de datos y los patrones bastaría calcular la
distancia euclídea entre ambos. Con esto se crea un fichero de entrenamiento que contiene
aquellos valores que hiciesen mínima esta distancia. Evidentemente, la búsqueda no barre todo
el espectro de históricos registrados, por lo que se discrimina el espacio muestral en función de
la hora de búsqueda y el tipo de día, según sea: Lunes, Martes-Jueves, Viernes, Sábado,
Domingo o Vacaciones. El conjunto de patrones quedará conformado por aquellos vectores
que tengan menor distancia al vector de entrada, fijándose un número mínimo de patrones a
incluir para asegurar que el entrenamiento es correcto.
Este fichero se divide posteriormente en dos: uno de entrenamiento y otro de validación
posibilitando así la llamada validación cruzada. Una vez entrenada la ANN, se le propone el
vector correspondiente a la previsión y obteniéndose el valor de la misma. Este valor previsto
puede ser guardado como histórico virtual de cara a sucesivas previsiones.
Bloque 5. Salida
La salida debe ser lo más sencilla posible, ofreciendo la posibilidad gráfica y de lectura
directa, presentando la evolución prevista contrastada con la registrada en el periodo de
condiciones más similares y la del día de la semana equivalente anterior.
RESULTADOS
Los resultados obtenidos del desarrollo del sistema de previsión on-line, se analizan en
dos subapartados, uno correspondiente a una serie de precisiones técnicas con respecto a las
ANN utilizadas, y otro donde representamos las tablas de resultados propiamente dichas.
Investigaciones Europeas, Vol. 2, N° 3, 1996, pp. 61-79
67
De Abajo Martinez; N.; De la Fuente Garcia, D.; Gómez Gómez, D.
Algunas precisiones técnicas sobre las ann utilizadas
Como hemos dicho, si bien el objetivo de este artículo no es explicar el funcionamiento
de las ANN ni de sus fundamentos matemáticos, sí creemos que deben de incluirse algunos
datos técnicos en cuanto a su construcción. Así, se han variado los paradigma s de aprendizaje
entre tres posibles: Back-Propagation
Standard, Back-Propagation
con momento y
Quickpropagation. Los parámetros básicos ajustables en ellos son: el de aprendizaje (asociable
a la capacidad de alteración de la matriz de pesos en cada entrenamiento), el de momento
(capacidad de recuerdo directo de la matriz de pesos del ciclo anterior), el de nivel de ruido
(añadido a la derivada de la función de activación, evita mínimos locales en la minimización
que realiza el aprendizaje). Otros elementos ajustables son: la presentación aleatoria o no de los
patrones de aprendizaje, el número de neuronas de la capa intermedia (en nuestro caso
normalmente 13 neuronas), y en cada caso se incluye el número de ciclos de entrenamiento, lo
que ofrece una idea aproximada del tiempo de aprendizaje.
Tablas
Las tablas siguientes contienen a modo de ejemplo 11, 5 Y 4 previsiones y valores reales
de tres series realizadas en diferentes líneas (urbana-poco industrial y rural-industrial), con los
tres tipos de aprendizaje, el número de ciclos realizado para cada caso así como otra serie de
parámetros representati vos de los diferentes tipos de redes empleadas. Para cada línea se ha
calculado también los errores absoluto, relativo y el error acumulado para diferentes horas de
las previsiones obtenidas.
o Primera línea (tablal y 2): Línea urbana(100%) y poco industrial (17,5%).
Previsiones realizadas a las 11:00 para el día 35 de 1996 de las 12:00-17:00
Como se puede ver en las tablas 1 y 2, la mejor previsión es la novena para la primera
hora, resultado obtenido mediante una ANN back-propagation momenturn (ver características
en la tabla 1) y la undécima para el conjunto de previsiones con una ANN quick propagation.
o Segunda línea (tabla 3 y 4): Línea urbana(100%) y poco industrial (17,5%).
Previsiones realizadas a las 6:00 para el día 87 de 1996 de las 7:00-11:00
Como podemos observar en esta segunda línea, que se diferencia de la primera
solamente en los horarios de cálculo de previsiones, los mejores resultados corresponden a la
cuarta previsión para la primera hora (tabla 3) y la quinta para las horas agregadas (tabla 4) en
ambos casos la ANN es una back-rnomentum.
o Tercera línea (tabla 5 y 6): Línea rural( 82%) e industrial (43,7%)
Previsiones realizadas a las 21:00 para el día 26 de 1996 de las 22:00-1:00
En el caso de la línea rural, el modelo ANN es back-rnomentum
neuronas en la capa oculta y se obtiene en la previsión cuarta.
con mayor número de
A modo de resumen podemos decir que en las tablas anteriores se muestran algunas de
las previsiones obtenidas (las pruebas en realidad han sido con 12 líneas y los resultados
obtenidos han sido, en general, satisfactorios).
68
Investigaciones Europeas, Vol. 2, 03,1996, pp. 61-79
Sistema logistico de previsi6n on-line, mediante redes neuronales del sistema de distribucián
...
De la observación de las tablas, se puede deducir la importancia del ajuste de los
parámetros de la red y las dificultades de algunas franjas horarias donde los saltos cuantitativos
son muy importantes (primeras horas de la mañana) y donde los errores son muy notables,
imposibilitando un trabajo sistemático, al menos con los históricos de curvas y temperaturas
existentes hasta ahora.
La zona más importante para las compamas eléctricas es la franja 10:00 a 13:00
(estudiada en las tablas 1,2,3 y 4) por producirse generalmente en ella los picos diarios, lo que
obliga a reajustes en algunas zonas de distribución. En estas horas, y en general de 10:00 a
1:00, las previsiones son mucho más fiables (errores del 3%) siendo éstas zonas de trabajo más
seguras.
El último paso que realiza el sistema logístico de distribución es el que corresponde a
los descargos, y que consistiría simplemente en la observación de las previsiones de la línea
menos cargada, la cual sería desconectada si fuese necesario.
CONCLUSIONES
El objetivo del presente trabajo ha sido presentar una metodología para la implantación
de un sistema logístico de distribución en tiempo real mediante redes neuronales que consta de
diferentes módulos como toma de datos, corrección de errores, la categorización de las líneas,
utilización de redes neuronales artificiales y un módulo de salida.
El tipo de redes escogido y la metodología de selección de patrones, que calcula la
distancia entre el vector de datos en tiempo real y los patrones, permite el cálculo de
previsiones on-line mediante la correcta telecarga de datos.
Su capacidad de integración en módulos generales es alta al haberse desarrollado en un
soporte estándar (Linux), con un software shareware y sobre un hardware de bajo coste
(Pentium-100 Mhz) y con un resultados fácilmente transferibles bajo cualquier protocolo de
comunicaciones.
Los resultados, dispares, muestran la diversidad de las redes que engloban bajo un
mismo nombre topología s (y por coherencia: resultados) totalmente diferentes.'
NOTAS
(1) Agradecimientos.
Hidroeléctrica del Cantábrico sin sus datos y apoyo económico el proyecto habría sido
irrealizable, y en particular a D. Bautista Rodríguez Sánchez de cuya confianza dependió el proyecto y que
colaboró activamente con él, a D. Jose Luis García Villares por compartir abiertamente su experiencia y a D.
Pedro García Casielles por su colaboración desde la Universidad.
Investigaciones
Europeas, Vol. 2, N° 3, 1996, pp. 61-79
69
De Abajo Martlnez, N.; De la Fuente Garcia, D.; Gáme; Gámez, D.
ANEXO: ALGUNAS PARTICULARIDADES
DE LAS ANN
Al. Clasificación general
La filosofía genérica de las ANN es la reproducción del esquema cerebral, tanto en sus
unidades de proceso (neuronas), como en sus conexiones y modo de establecerlas. En 1943
apareció el primer modelo de neurona artificial gracias a McCulloh y Pitts [9] conocido por
neurona formal. En 1986 se concretaron los procedimientos deterministas conocido como
"Back-Propagation",
modelo de gran vigencia aún hoy en día (Rurnelhart, Hinton y
Willians,[RumelhartI986]).
Uno de los esquemas de clasificación de ANN más frecuentemente utilizados es el de la
figura 7 que se basa en el tipo de datos con los que trabaja: binarios (l/O) o de elementos
continuos. De cada uno de ellos surgen tratamientos muy diferentes.
Conceptos comunes a ambos son la "supervisión" y la "no supervisión". Los primeros
se caracterizan por presentárseles patrones de salida con los que contrastan y corrigen sus
resultados. Los segundos no permiten ese contraste y se apoyan en la asociación de
características homogéneas. El modelo que se ha utilizado en este artículo ha sido el basado en
el Perceptrón Multicapa con paradigma Back-Propagation.
A2. Breve Cronología del paradigma Back-propagatíon
El Back-Propagation es un eficiente procedimiento recursivo para calcular como variará
la salida de un sistema no lineal complejo cuando se varían algunos parámetros internos (p.e,
los pesos). Estos parámetros son variados en el sentido en el que disminuye la diferencia entre
la salida actual y la deseada.
Como el Back-Propagation no requiere ejemplos estocásticos durante el aprendizaje
puede ser fácilmente implementado en un ordenador convencional, y ha sido el más popular de
los nuevos procedimientos. Durante los últimos años ha sido aplicado a numerosos problemas
simulados y reales. Hinton, a finales de los ochenta, revisó algunas de estas aplicaciones y
proponiendo ciertas variaciones del procedimiento.
El Back-Propagation tiene una larga y compleja historia, se puede decir que es una
generalización depurada de la técnica de corrección del error del gradiente de Widrow-Hoff
[17]. Fue descrita por Werbos[17], pero su importancia no fue en su momento reconocida,
quizás porque no se desarrollaron suficientemente sus posibilidades en la construcción de
representaciones internas apropiadas e interesantes. Fue ampliado hacia 1981 por David
Rumelhart y David Parquer por separado, pero ninguno publicó artículo alguno en unos años.
Por ello, fue mejorado por Le Cun en 1986.
Una de las razones por las que Rumelhart inicialmente no investigó más profundamente
el Back-Propagation es que, como en todos los procedimientos del gradiente, puede quedarse
bloqueado en un mínimo local. Un importante resultado de la experiencia es que esto no suele
generar grandes problemas, sino que el tiempo de convergencia es, a menudo, una limitación
más severa, especialmente para aplicaciones largas. En realidad este procedimiento puede ser
70
Investigaciones Europeas, Vol. 2, N" 3,1996, pp. 61-79
Sistema logistico de previsión on-line, mediante redes neuronales del sistema de distribución
...
aplicado a cualquier sistema compuesto de módulos interactivos que obedezcan a las siguientes
reglas de diseño:
./
Las derivadas de las salidas de un módulo con respecto a las entradas que recibe de
otros módulos deben ser limitadas y calculables de modo eficiente .
./
Algunos módulos deben tener parámetros internos, y las derivadas de las salidas
con respecto a estos parámetros deben ser limitadas y calculables de forma
eficiente.
A3. Descripción de paradigma Back-propagation.
Las redes neuronales (o redes de neuronas artificiales), son modelos matemáticos
simplificados de las redes de neuronas que constituyen el cerebro humano. Estos modelos,
están compuestas por un conjunto de "neuronas artificiales" o conjunto de unidades que
procesan e intercambian información. Las neuronas de una red, están estructuradas en distintas
capas, de forma que una neurona de una capa está conectada con las de la capa siguiente, a las
que puede enviar información.
Tal como se refleja en la figura 5, la arquitectura más habitual consiste en una capa de
neuronas de entrada que recibe la información "del exterior", una serie de capas intermedias (u
"ocultas") y una capa de salidas, que proporciona "al exterior" el resultado del trabajo de la red.
Cada neurona, tal como se muestra en la figura 8, constituye una "unidad de
procesamiento" de información, convierte un conjunto de señales de entrada en una salida que
es difundida a las neuronas de la capa siguiente. Esta conversión se realiza en dos etapas:
primero, cada una de las señales de entrada es multiplicada por un coeficiente de ponderación
("peso sináptico") atribuido a la conexión; todos los productos son sumados para obtener una
cantidad denominada "entrada ponderada total". En una segunda fase, cada unidad utiliza una
función de transferencia entrada-salida, o función de activación, que transforma la entrada
ponderada total en una señal de salida que es la que se difunde a las neuronas de la capa
siguiente. La función de transferencia puede ser de tres tipos (Lippmann, 1987):
1.- Lineal. La actividad de salida es proporcional a la entrada ponderada total.
2.- De umbral. La salida queda fija a uno de dos niveles, dependiendo si la entrada
ponderada total es mayor o menor que cierto valor crítico denominado "umbral".
3.- Sigmoide. La salida varía de forma continua dependiendo de la entrada ponderada
total, pero esta dependencia no es lineal.
Habitualmente, se suele utilizar la sigmoide como función de transferencia cuando se
trata de aplicar la tecnología de redes neuronales al procesado de señales no-lineales (Lapedes
y Farber, 1987), aunque es necesario tener presente que las tres son aproximaciones bastante
burdas de la actividad de las neuronas reales.
El proceso de aplicación de estas redes neuronales a un problema concreto, consta de
tres etapas fundamentales:
Investigaciones Europeas, Vol. 2, N° 3,1996,
pp. 61-79
71
De Abajo Marttnez, N.; De la Fuente García, D.; Gámez Gomez, D.
1.- Diseño de la Red. Es necesario decidir la arquitectura que va a tener la red, lo cual
implica determinar el número de neuronas de la capa de entradas, el número de
capas ocultas y las neuronas que contendrá cada una de ellas y por último, el número
de neuronas de la capa de salidas. La arquitectura de la red dependerá como es
lógico, del problema concreto que se quiera resolver.
2.- Entrenamiento de la Red Neuronal Artificial. El entrenamiento de una Red Neuronal
es la utilización de un algoritmo para ajustar los pesos sinápticos de las conexiones
entre las neuronas. El proceso consiste en presentar a la red inicial una batería de
casos de entrenamiento, que se construyen utilizando los datos reales disponibles (el
pasado de la serie temporal). Cada uno de estos casos está compuesto por una serie
de valores de entrada y el valor de salida correspondiente. Se asignan los valores de
entrada a las neuronas de la capa de entradas, y se obtiene al final un valor de salida
de la red neuronal. Esta respuesta se compara con la deseada u objetivo, mediante
una función de error que da una medida de la eficacia de la configuración actual de
pesos sinápticos de la red. El objetivo del aprendizaje es minimizar esta función de
error. Esto es así en el caso de las ANN supervisadas.
3.- Utilización de la Red Neuronal en "Modo Recuerdo". Una vez entrenada, la Red
Neuronal está en condiciones de ser utilizada. Para ello, no hay más que presentar a
la red un caso determinado (por ejemplo los últimos datos disponibles de una serie
temporal) para que, utilizando los pesos sinápticos encontrados durante el proceso
de entrenamiento, calcule la salida (la previsión del dato siguiente de la serie
temporal).
72
Investigaciones
Europeas, Vol. 2, N° 3,1996, pp. 61-79
Sistema logistico de previsión on-line, mediante redes neuronales del sistema de distribución
...
BIBLIOGRAFÍA
[1)
[2)
[3)
[4]
[5)
[6)
[7)
[8)
[9)
[10)
[11)
[12)
(14)
[15)
(16)
[17)
[18)
DILLON et al. (1991) Short term load forecasting using an adaptive neural network. Electric Power & Energy
Systems. Vol 13 Agosto pags 186-194.
BOX, G.E.P. y COX D.R. (1964) An analisis ot transformations ,Journal of the Royal Statistical Society, B, 8,
pags 27-41.
BOX, G.E.P. y JENKINS G.M. (1976) Time series Analysis Forecasting and control. Holden Day, segunda
edición.
HO, S. y HSU, D. (1992) Short term load forecasting using an artificial neural network with an adaptative
learning algorithm. Transactions on Power Systems. Vol. 7 Febrero pags 141-149.
HOPF1ELD, IJ. (1982) Neural and physical Systems. Proceeding National Academic of Science. USA.
KOHONEN ,T. (1984) Self-Organization and Associative Memory. Springer-Verlag,
LEE, K.Y. Y CHA, Y.T. (1992) Short tenn load forecasting using an artificial neural network. Transactions on
Power Systems. Vol7 Febrero pags 124-132
LIEW, K. y CHANG. T. (1994) A neural network short-term load forecaster. Electric Power Systems Research.
Pags: 34-57.
MCCULLOCH, W.S. y PITIS W. (1943) A logical calculus of the ideas inmanent in nervous activity. Bulletin
of Mathematical Biophysics, 9 127-147.
MOHAMED, O. et al. (1995) Practical experiences with an Adaptive Neural Network Short-Terrn Load
Forecasting Systems. IEEE Transactions on Power Systems. Febrero. 110-131.
PARK, M. Y EL-SHARKAWI.
A. (1991) Electric load forecasting using an artificial neural network. IEEE
Transactions on Power Systems Vol 6 Mayo pag 442-449.
PENG, K. (1992) Advancement
in the application of neural networks for short term load forecasting.
Transactions on Power Systems. Pago 23-41.
RUMELHART, D.E. et. al. (1986) Learning internal representations by error propagation, P.D.P. pags 318-362.
VANKAYALA V.S., y RAO N.D. (1993) Artificial neural networks and their applications to power systems.
V.S .. Electric Power Systems Research. 28 pag 67-79.
VILLARES J.L. el. al. (1996) A neural network based hourly electric load forecasting system. Documento de
trabajo.
WERBOS, P.J. (1974): Beyond regresion: New tools for prediction and analysis in the behavioral sciences.
Master Thesis. Harvard University.
WIDROW, B. y HOFF M.E. (1960) Adaptative switching circuits Ire Wescon Conv. Record, 4: 96-104
Investigaciones
Europeas, Vol. 2, N" 3, 1996, pp. 61-79
73
De Ahajo Martinez; N.; De la Fuente Carda, D.; Gáme: Gámez; D.
ANEXO
FIGURA 1: ESQUEMA DE INTERCONEXIÓN
DE PUNTOS DEONSUMO [TOPOLOGÍA]
o
Ipunto de consumo/adaptación
ILínea subterránea de media tensión
FIGURA 2: CRONOLOGÍA
Representación
DE ESTUDIOS PREVIOS
I
IARIMA
I
IPRELIME
I
Recogida y Análisis de documentación
FIGURA 3: DESCRIPCIÓN DEL SISTEMA LOGÍSTICO
DE DISTRIBUCIÓN EN TIEMPO REAL
Bloque O
TRANSMISOR
HP=>PC
Bloque 1:
-
Bloque 3:
CORRECTOR
de
ERRORES
----------. PREPARACION
1
de
PATRONES
Bloque 5
Bloque 4
~
PREVISION
-
SALIDA
ANN
Bloque 2:
CATEGORlZADOR
de
LÍNEAS
74
Investigaciones
Europeas, Vol. 2, N° 3,1996, pp. 61-79
Sistema logistico de previsión on-line, mediante redes neurona/es del sistema de distribución
FIGURA 4: ENTORNOS TEMPORALES
Segundo entorno:
6 hora", (36 medidas)
...
PARA EL ESTUDIO DE ERRORES
previas al punto de
previsión
Primer entorno:
1 hora (6 medidas) previas al punto de
previsión
Tercer entorno:
24 horas previas al punto de previsión
Cuarto entorno:
1 semana
previa al pumo de previsión
Quinto entoroo:
4 semanas previa" al punto de previsión
FIGURA 5: ESTRUCTURA
GENERAL DE LA ANN UTILIZADA
Capa Intermedia:
número variable de
neuronas
FIGURA 6: SELECCIÓN DE PATRONES DE ENTRENAMIENTO
SEMEJANZA CON EL VECTOR DE ENTRADA
,.
..
..
POR
Vector formado por el conjunto de datos de las horas
previas a la previsión y las temperaturas
....
......
/
.>
.¿~~------~
Investigaciones
Posible patrón de entrenamiento formado por el conjunto de
datos de carga tomados de los históricos y las temperaturas
correspondientes. Se tomaran aquellos que más se parezcan al
vector
Europeas, Vol. 2, N° 3, 1996, pp. 61-79
75
De Abajo Maninez; N; De la Fuente García, D.; Gáme; Gómez, D.
FIGURA 7: CLASIFICACIÓN
DE LAS ANN.
Entrada Continua
--------------Supervisada
Perceptron
No Supervisada
I
Perceptron
Multicapa
Mapas de
Kohonen
--------------Entrada Binaria
Supervisada
No Supervisada
~
I
Red
Hopfield
Red
Harnming
Clasificador de
Carpenter&Grossberg
(ARTl)
TABLAl: LÍNEA URBANA.
HORA
DATOS REALES
Prev 1: Back standard
Aprendizaje: 0.2
Prev2: Back standard
Aprendizaje: 0.3
Prev3: Back momentum:
Aprendizaje: 0.2
Ciclos: 15000
Prev4: Back momentum:
Aprendizaje: 0.2
Ciclos: 20000
Prev5: Back momentum:
Aprendizaje: 0.1
Ciclos: 10000
Prev6: Back momentum:
Aprendizaje: 0.1
Ciclos: 20000
Prev7: Back momentum:
Aprendizaje: 0.5
Ciclos: 10000
76
12:00
0.678
0.702
13:00
0.677
0.717
14:00
0.701
0.721
15:00
0.721
0.710
16:00
0.691
0.705
17:00
0.692
0.705
0.704
0.733
0.733
0.706
0.694
0.697
0.1
0.705
0.720
0.711
0.683
0.671
0.672
0.1
0.705
0.727
0.725
0.701
0.691
0.692
O.l
0.702
0.705
0.693
0.682
0.681
0.680
0.1
0.701
0.692
0.660
0.615
0.599
0.593
0.1
0.699
0.718
0.720
0.706
0.701
0.701
Investigaciones
Europeas, Vol. 2, N° 3, 1996, pp. 61-79
Sistema logistico de previsión. on-line, mediante redes neuronales del sistema de distribución
HORA
DATOS REALES
Prev8: Back momentum: 0.2
Aprendizaje: 0.1
Nivel de ruido: 0.1
Ciclos: 7500
Prev9: Back momentum: 0.2
Aprendizaje: 0.1
Nivel de ruido: 0.3
Ciclos: 5500
Prev 10:Quick.Propagation
Aprendizaje: 0.2
Cambio máximo:0.1
Contracción pesos: 0.0001
Ciclos: 8500
Prev 11:Quick.Propagation
Aprendizaje: 0.2
Cambio máximo:0.3
Contracción pesos: 0.0001
Ciclos: 8500
12:00
0.678
0.702
13:00
0.677
0.707
14:00
0.701
0.697
15:00
0.721
0.674
16:00
0.691
0.665
17:00
0.692
0.662
0.698
0.713
0.715
0.693
0.681
0.680
0.702
0.724
0.721
0.689
0.676
0.674
0.702
0.713
0.714
0.702
0.695
0.695
...
TABLA 2: MEDIDAS DE ERROR:
ERROR EN LAS HORAS DE
PREVISION
SERIE
ERROR ABSOLUTO
EN LA PRIMERA
HORA
ERROR RELATIVO
EN LA PRIMERA
HORA(%)
n
1/ n·
I. (xreal
- XJ2
J
PREV1
PREV2
PREV3
PREV4
PREV5
PREV6
PREV7
PREV8
PREV9
PREVIO
PREVII
0.024
0.026
0.027
0.027
0.024
0.023
0.021
0.024
0.020
0.024
0.024
Investigaciones
3.54
3.83
3.98
3.98
3.54
3.39
3.10
3.54
2.95
3.54
3.54
Europeas, Vol. 2, N° 3, 1996, pp. 61-79
0.055
0.071
0.070
0.065
0.056
0.179
0.054
0.073
0.054
0.069
0.049
77
De Abajo Martinez; N.; De la Fuente García, D.; Gáme; Gámez; D.
TABLA 3: LÍNEA URBANA.
HORA
DATOS REALES
Prevl: Back momentum: 0.2
Aprendizaje: 0.1
Ciclos: 10000
Prev2: Back momentum: 0.2
Aprendizaje: 0.05
Ciclos: 10000
Prev3: Back momentum: 0.1
Aprendizaje: 0.05
Ciclos: 10000
Prev4: Back momentum: 0.05
Aprendizaje: 0.05
Ciclos: 10000
Prev5: Back momentum: 0.05
Aprendizaje: 0.05
Ciclos: 10000
Sin aleatoriedad entre patrones
7:00
0.334
0.277
8:00
0.446
0.427
9:00
0.515
0.549
10:00
0.599
0.612
11:00
0.617
0.670
0.277
0.425
0.545
0.609
0.667
0.280
0.409
0.542
0.597
0.659
0.289
0.404
0.550
0.606
0.663
0.288
0.409
0.546
0.602
0.662
TABLA 4: MEDIDAS DE ERROR:
SERIE
PREVl
PREV2
PREV3
PREV4
PREV5
ERROR ABSOLUTO EN LA ERROR RELATIVO EN
LA PRIMERA HORA(%)
PRIMERA HORA
17.01
0.057
17.01
0.057
0.054
16.17
13.47
0.045
13.77
0.046
ERROR EN LAS HORAS
DE PREVISION
0.088
0.085
0.082
0.085
0.080
TABLA 5: LÍNEA RURAL E INDUSTRIAL.
HORA
DATOS REALES
Prev1: Back momentum: 0.05
Aprendizaje: 0.05
Nivel de ruido: 0.1
Ciclos: 17500
Prev2: Back momentum: 0.2
Aprendizaje: 0.05
Nivel de ruido: 0.1
Ciclos: 17500
Prev3: Back momentum: 0.01
Aprendizaje: 0.005
Nivel de ruido: 0.1
Ciclos: 17500
78
22:00
0.522
0.487
23:00
0.442
0.455
00:00
0.370
0.384
01:00
0.321
0.312
0.494
0.444
0.390
0.337
0.490
0.461
0.397
0.330
Investigaciones
Europeas, Vol. 2, N° 3,1996, pp. 61-79
Sistema logistico de previsión on-line, mediante redes neurona/es del sistema de distribución
HORA
DATOS REALES
Prev4: Back momentum: 0.01
Aprendizaje: 0.005
20 neuronas de capa intermedia
Ciclos: 6000
22:00
0.522
0.504
23:00
0.442
0.446
00:00
0.370
0.395
...
01:00
0.321
0.337
TABLA 6: MEDIDAS DE ERROR:
SERIE
PREVl
PREV2
PREV3
PREV4
Investigaciones
ERROR
ABSOLUTO EN
LA PRIMERA
HORA
0.035
0.028
0.032
0.018
Europeas, Vol. 2, N° 3,1996,
ERROR
RELATIVO EN
LA PRIMERA
HORA(%)
6.7
5.36
6.13
3.4
pp. 61-79
ERROR EN LAS
HORAS DE
PREVISION
0.041
0.038
0.047
0.035
79