Download Capítulo1. Introducción - Posgrado en Ingeniería de Sistemas
Document related concepts
Transcript
UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA DIVISIÓN DE ESTUDIOS DE POSGRADO “PRONÓSTICO DE DEMANDA POR MEDIO DE REDES NEURONALES ARTIFICIALES (RNAs) EN LA INDUSTRIA DE TELECOMUNICACIONES” POR MARÍA ANGÉLICA SALAZAR AGUILAR TESIS EN OPCIÓN AL GRADO DE MAESTRO EN CIENCIAS EN INGENIERÍA DE SISTEMAS San Nicolás de los Garza, N. L. Noviembre de 2005 UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA DIVISIÓN DE ESTUDIOS DE POSGRADO “PRONÓSTICO DE DEMANDA POR MEDIO DE REDES NEURONALES ARTIFICIALES (RNAs) EN LA INDUSTRIA DE TELECOMUNICACIONES” POR MARÍA ANGÉLICA SALAZAR AGUILAR TESIS EN OPCIÓN AL GRADO DE MAESTRO EN CIENCIAS EN INGENIERÍA DE SISTEMAS San Nicolás de los Garza, N. L. Noviembre de 2005 UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN Facultad de Ingeniería Mecánica y Eléctrica División de Estudios de Posgrado Los miembros del Comité de Tesis recomendamos que la tesis “Pronóstico de Demanda por medio de Redes Neuronales Artificiales (RNAs) en la Industria de Telecomunicaciones”, realizada por la alumna María Angélica Salazar Aguilar con número de matrícula 01294370, sea aceptada para su defensa como opción al grado de Maestro en Ciencias en Ingeniería de Sistemas. El Comité de Tesis Dr. Mauricio Cabrera Ríos Asesor Dr. J. Arturo Berrones Santos Revisor Dr. Francisco R. Angel‐Bello Acosta Revisor Dr. Guadalupe Alan Castillo Rodríguez Subdirector División de Estudios de Posgrado Ciudad Universitaria, Noviembre de 2005 “La incertidumbre es una margarita cuyos pétalos no se terminan jamás de deshojar…” A Dios, Mi fuente inagotable de vida. A mi familia, Mi más preciado tesoro. RESUMEN Una de las tareas más importantes en el ámbito de los negocios es hacer pronósticos de demanda. En el presente trabajo se realiza esta tarea utilizando modelos de Redes Neuronales Artificiales (RNAs) con el objetivo de resolver un problema real para una empresa de telecomunicaciones. El principal problema al que se enfrenta la empresa es la determinación de la capacidad requerida en la red de transmisión de manera tal que la demanda se satisfaga al 100% sin incurrir en costos excesivos por mantener capacidad instalada no utilizada. Por ello, es de vital importancia la determinación precisa del pronóstico de demanda. La empresa nos brindó información del comportamiento de la demanda en los últimos años de operación. Optamos por un modelo de RNAs para pronóstico pues éstas han sido muy utilizadas en trabajos recientes con buenos resultados. Sin embargo, el desempeño de la RNA depende de la selección adecuada de los parámetros que intervienen en el modelo. La ausencia de una metodología estándar para la selección de los parámetros nos motivó a proponer una metodología que hace uso de técnicas estadísticas y optimización para la selección adecuada de los parámetros del modelo de RNAs en esta aplicación. El desarrollo de esta metodología constituye una de las contribuciones más importantes de este trabajo. Probamos la metodología con los datos que nos brindó la empresa y finalmente construimos modelos de RNAs para pronóstico de uno y doce períodos. En la literatura se encontraron muy pocas referencias de RNAs para el pronóstico simultáneo de múltiples períodos, por lo que se espera que este trabajo contribuya importantemente en v este aspecto. Los resultados obtenidos mediante RNAs fueron comparados contra los que se obtuvieron con métodos lineales tradicionales y en nuestro caso, los modelos de RNAs desarrollados de acuerdo a la metodología propuesta mostraron mejor calidad en el pronóstico que los métodos lineales utilizados. vi ESTRUCTURA DE LA TESIS La tesis está organizada de la manera siguiente: En el Capítulo 1 se presenta la descripción general del problema, algunos antecedentes, el método de solución propuesto, así como el objetivo, justificación e hipótesis del mismo. El Capítulo 2 contiene los antecedentes acerca de las diferentes áreas que se conjugan en el desarrollo del presente trabajo, éstas son: Series de Tiempo, Redes Neuronales Artificiales (RNAs), Análisis y Diseño de Experimentos y Optimización. En el Capítulo 3 se describe de manera detallada la metodología propuesta para la selección de parámetros de RNA para pronóstico de series de tiempo. El Capítulo 4 contiene el análisis de una serie de tiempo mediante un modelo de RNAs para predecir un solo período. El modelo de RNA fue creado siguiendo la metodología propuesta en el Capítulo 3. El Capítulo 5 es de los más relevantes en este trabajo. En él se describe el desarrollo de dos modelos de RNAs para la predicción de demanda de múltiples períodos. En el Capítulo 6 se presenta una comparación de los resultados obtenidos a partir de métodos lineales tradicionales contra los obtenidos mediante RNAs. Los resultados aquí descritos sustentan la validez de la metodología propuesta en el Capítulo 3. En el Capítulo 7 se describe de manera general la herramienta de soporte a la toma de decisiones que permite realizar un experimento de tipo factorial con modelos de RNAs. vii Para finalizar, el Capítulo 8 contiene las conclusiones, aportaciones y trabajo futuro. Las referencias bibliográficas, lista de tablas, lista de figuras y los apéndices están disponibles al finalizar la sección de capítulos. viii INDICE RESUMEN v ESTRUCTURA DE LA TESIS vii Capítulo 1. INTRODUCCIÓN 1 1.1. Descripción del Problema ………………...…………………………….……… 1 1.2. Antecedentes …………………………………………………………….……... 3 1.3. Objetivo ………………………………………………………………………… 4 1.4. Justificación …………………………………………………………………...… 5 1.5. Hipótesis ……………………………………………………………………...… 6 Capítulo 2. ANTECEDENTES 7 2.1. Análisis de Series de Tiempo ………………………………………………...… 2.2. Redes Neuronales Artificiales (RNAs) ……………………………………..… 8 10 2.2.1. Aplicaciones de las RNAs en pronósticos de series de tiempo …..... 14 2.2.2 Decisiones en la aplicación de RNAs para pronósticos de series de tiempo ………………………………………………………………..……………… 19 2.3. Análisis y Diseño de Experimentos ………………………………………….... 20 2.4. Optimización ………………………………………………………………..… 22 Capítulo 3. METODOLOGÍA PROPUESTA 28 3.1 Descripción de la Metodología ……………………...………………………… 29 Capítulo 4. PRONÓSTICO DE SERIES DE TIEMPO DE UN SOLO PERÍODO 4.1. Pronóstico de Demanda en telecomunicaciones ……………...………………. 37 38 4.2. Construcción del Modelo de RNA para Pronóstico de Series de Tiempo de un solo período ………………………………………………………………………..…… 40 4.2.1. Descripción de la RNA como Sistema ……………………………… 40 4.2.2. Análisis y Diseño de Experimentos ………………….……………… 45 4.2.3. Metamodelación ………………………………………………….…. 48 4.2.4. Problemas de Optimización y Solución ……………………………... 53 4.3. Conclusiones ……………..…………………………………………………… 56 Capítulo 5. PRONÓSTICO DE SERIES DE TIEMPO MÚLTIPLES PERÍODOS 5.1. Pronóstico de Demanda en telecomunicaciones: múltiples períodos ………….. DE 57 58 5.2. Construcción de un Modelo de RNA para Pronóstico de Series de Tiempo de múltiples períodos ………………………………………………………………… 61 5.2.1. Descripción de la RNA como Sistema …...…….….…………...…… 61 5.2.2 Análisis y Diseño de Experimentos para la Serie 1 ….………………. 65 5.2.2.1. Metamodelación ………………………….…………...…... 67 5.2.2.2. Problemas de Optimización y Solución, Serie 1 ……….…. 74 5.2.3. Análisis y Diseño de Experimentos para la Serie 2 …………….….. 77 5.2.3.1. Metamodelación …………….…………………...……...… 78 5.2.3.2. Problemas de Optimización y Solución, Serie 2 ….……..… 84 5.3. Conclusiones ……………………………………………………..…………… 87 Capítulo 6. COMPARACIÓN DE RESULTADOS DE RNAs CONTRA MÉTODOS LINEALES TRADICIONALES 88 6.1. Pronóstico de demanda de un período en telecomunicaciones mediante métodos lineales tradicionales …………………………………………………....………… 89 6.1.1. Comparación de Resultados …………...…………………………… 90 6.2. Pronóstico de Demanda de n períodos en telecomunicaciones mediante métodos lineales tradicionales ……………………………………………...………………. 92 6.2.1. Comparación de Resultados ………...……………………………… 94 6.3. Conclusiones ……………………………..…………………………………… 97 Capítulo 7. INSTAURACIÓN DE LA HERRAMIENTA DE SOPORTE A LA TOMA DE DECISIONES 98 7.1. Descripción de la herramienta de soporte a la toma de decisiones ………….. 99 7.2 Conclusiones …………………………………………………………….…… 104 Capítulo 8. CONCLUSIONES, CONTRIBUCIÓN Y TRABAJO FUTURO 105 BIBLIOGRAFÍA 108 LISTA DE FIGURAS 115 LISTA DE TABLAS 119 APÉNDICES 121 Apéndice A1 ………………………….………………………………………….. 121 Apéndice A2 …………………………………….……………………………….. 138 Apéndice A3 …………………………………….……………………………….. 145 Apéndice B1 …………………………………….……………………………….. 148 Apéndice B2 ……………………………………..…………………………...….. 150 Apéndice B3 ………………………………………………………………….….. 154 Apéndice B4 ………………………………………………………………….….. 155 Apéndice B5 ………………………………………………………………….….. 156 Apéndice C ………………………………………………………………….…… 160 AUTOBIOGRAFÍA 183 CAPÍTULO 1 INTRODUCCIÓN En toda industria, la planeación es una necesidad. Un objetivo importante de la tarea de planear es tratar de prever lo que puede suceder en el futuro. La motivación de este trabajo proviene de una empresa de telecomunicaciones que tiene la necesidad de planear a nivel operacional, estratégico y táctico para mantenerse competitiva ante las fluctuaciones de mercado y cursos de acción de sus competidores. Esta empresa, como la mayoría de las empresas, tiene como objetivo principal generar utilidades y brindar un alto nivel de servicio a sus clientes. 1.1. Descripción del Problema Como se observa en la Figura 1.1, el principal recurso de la empresa es una red de transmisión, que puede ser definida como un conjunto de equipos interconectados que poseen una capacidad finita de transmisión. Los clientes demandan la utilización de la red en forma estocástica. Capítulo1. Introducción 2 Para cumplir con el alto nivel de servicio y maximizar las utilidades, la red de transmisión debe tener capacidad suficiente para satisfacer la demanda de los clientes sin incurrir en exceso de capacidad ociosa, dado el alto costo de los equipos. Ahora bien, le corresponde al tomador de decisiones determinar ¿Cuál debe ser la capacidad de esta red?. 1. vo jeti b O n ión isió rmac M 2. info a ir s, mit iente y en s n l Tra us c hora s r r de lquie luga r a e u i c lqu cua D es em to an cá da 4 st n .C ic se li a rv ent ic es io de m n co n ió is ” os m ita rs ns fin cu tra d Re de ida 3. d ac e R ap “c an er a ¿Cómo planear la capacidad de la Red? Figura 1.1. Descripción del problema de Telecomunicaciones. El tomador de decisiones lleva a cabo un proceso de planeación de capacidad, a través de una estimación del comportamiento futuro de la demanda. Esta estimación, muchas veces es realizada de manera intuitiva, considerando únicamente la experiencia del tomador de decisiones. Sin embargo, cuando es posible obtener información Capítulo1. Introducción 3 cuantitativa acerca del comportamiento de la demanda a través del tiempo, es decir, cuando se dispone de una serie de tiempo, una técnica típicamente utilizada es el Análisis de Series de Tiempo. La Figura 1.2 muestra un ejemplo de una serie de tiempo. Una vez que se tienen pronósticos, el tomador de decisiones puede determinar la capacidad que se requiere en la red de transmisión para satisfacer la demanda. Puede además determinar con anticipación si se requiere una expansión de capacidad, resultando en una mejor planeación del presupuesto anual, así como en un mejor aprovechamiento de los recursos económicos de la empresa. 800 700 Valor Registrado 600 500 400 300 200 100 0 1 7 13 19 25 31 37 43 49 t Figura 1.2: Ejemplo de una Serie de Tiempo. 1.2. Antecedentes Por muchos años, el análisis de series de tiempo ha estado dominado por la utilización de métodos estadísticos lineales que se pueden implementar de manera conveniente, sin embargo, la existencia de relaciones no lineales entre los datos pueden limitar la aplicación de estos modelos (Makridakis et al., 1982). En la práctica es muy posible encontrar relaciones no lineales en los datos, tal como sucede en nuestro caso de Capítulo1. Introducción 4 estudio. Por ello es necesaria la utilización de técnicas capaces de reflejar dicho comportamiento. La utilización de Redes Neuronales Artificiales (RNAs) para pronósticos de series de tiempo es relativamente nueva en la literatura, sin embargo, lo positivo de los resultados en las aplicaciones prácticas la convierten en un área prometedora. En nuestro caso, la empresa nos brindó información histórica de registros mensuales acerca de la utilización de la red de transmisión de los últimos 6 años. Aprovechando esta información, realizamos el pronóstico de la demanda para períodos posteriores, mediante el uso de RNAs. Al intentar desarrollar el modelo de RNAs para esta aplicación de pronóstico de series de tiempo, nos encontramos que la exactitud del pronóstico de la RNA depende de varias decisiones sumamente importantes en cuanto a la definición de los parámetros que intervienen en el modelo así como de la arquitectura de RNA que se esté utilizando (Zhang, 2004). Algunas de estas decisiones pueden ser tomadas en el proceso de construcción del modelo, mientras que otras requieren ser especificadas antes de que comience la modelación. Este es un problema, ya que no existe una regla establecida que nos permita tomar tales decisiones de manera adecuada. Por esta razón, planteamos el siguiente objetivo en este trabajo de tesis. 1.3. Objetivo El objetivo de esta tesis consiste en proponer y probar una metodología para la selección de parámetros de un modelo de RNAs para este caso de estudio que garantice pronósticos confiables para hasta doce períodos. Adicionalmente se desarrollará la herramienta computacional correspondiente con el fin de ayudar al tomador de decisiones a planear la capacidad de la red de transmisión en la empresa de telecomunicaciones. Capítulo1. Introducción 5 1.4. Justificación Decidimos analizar los datos históricos mediante RNAs ya que éstas surgieron como una herramienta de modelación cuantitativa y han sido aplicadas con éxito en un amplio número de problemas de predicción en casi todas las áreas de negocios, industria y ciencia (Widrow et al., 1994). Los trabajos realizados a través de éstas han mostrado que tienen características atractivas para la predicción y clasificación de patrones. Además, aunque el análisis de series de tiempo ha provisto una cantidad de herramientas estadísticas disponibles para este fin, esto es, para hacer pronósticos, la mayoría de estas herramientas presuponen un modelo generador central con un error aleatorio al cual se le asocia una distribución probabilística. La verificación de este supuesto demanda un cierto nivel de entendimiento de los métodos estadísticos utilizados. Este hecho puede dificultar la exitosa instauración de un sistema de pronósticos en la industria. Las redes neuronales artificiales son fáciles de utilizar y por otro lado, sus capacidades de adaptación y de modelación no lineal las hacen atractivas para su utilización en pronósticos de series de tiempo. Aún cuando el comportamiento de la serie es lineal, las RNAs han mostrado ser exitosas y competitivas como herramientas de modelación (Hwarng, 2001; Medeiros et al., 2001; Zhang et al., 2001). A continuación se describen las hipótesis bajo las cuales se desarrolló el presente trabajo. Capítulo1. Introducción 6 1.5. Hipótesis Existe una dependencia del valor de la demanda en un instante de tiempo t con los valores registrados en instantes de tiempo anteriores a t y el modelo generador de dichos valores es desconocido. Por otra parte, dado que la dependencia es muchas veces no lineal, podemos capitalizar en la capacidad de las RNAs para aproximar adecuadamente este tipo de dependencia. En la construcción de un modelo de RNAs partimos del supuesto de que una selección adecuada de los parámetros de las RNAs traerá consigo una precisión de pronósticos mejor que la que se puede obtener a través de métodos basados en dependencias lineales. CAPÍTULO 2 ANTECEDENTES Introducción Es del interés del área de planeación de la empresa obtener pronósticos confiables que le permitan llevar a acabo la planeación de capacidad de la red de transmisión mediante un buen aprovechamiento del capital. Por ello la importancia de obtener pronósticos confiables. La realización del pronóstico en este trabajo se llevó a cabo mediante el análisis de la serie de tiempo utilizando RNAs. Para obtener pronósticos confiables es necesario seleccionar de manera adecuada los parámetros que intervienen en el modelo de RNA. No hay una metodología estándar para ajustar dichos parámetros. En este trabajo se propone una metodología para la selección sistemática de los mismos. En este capítulo se presenta la información teórica de diferentes técnicas integradas en la metodología propuesta. En la Sección 2.1 se describe brevemente el análisis de series de tiempo así como las principales aplicaciones y técnicas utilizadas para llevarlo a cabo. La Sección 2.2 contiene los antecedentes de las RNAs, algunas aplicaciones prácticas y cómo han sido utilizadas en el análisis de series de tiempo. En la Sección 2.3 se describe Capítulo 2. Antecedentes 8 lo que es un análisis de experimentos de tipo factorial y por último, la Sección 2.4 contiene información básica acerca de la optimización de modelos. 2.1. Análisis de Series de Tiempo A lo largo de la historia, pronosticar el comportamiento de algún fenómeno ha ido adquiriendo una gran importancia que se puede ver reflejada en la diversidad de aplicaciones desarrolladas en las diferentes áreas del conocimiento. Las situaciones en las que se requiere un pronóstico tratan de estimar un comportamiento futuro, por tanto, el tiempo está directamente involucrado y existe la presencia de incertidumbre. Para la elaboración de un pronóstico se requiere especificar el punto específico en el tiempo para el cual se desea obtener el pronóstico. La calidad del pronóstico depende en gran medida de esta especificación, así como de la disponibilidad de la información histórica acerca de la variable de interés. Es posible decir entonces que a mayor período de tiempo, habrá mayor incertidumbre en pronósticos puntuales. Existen diversas metodologías que nos permiten elaborar pronósticos. La selección de una de ellas depende de diversos factores tales como: la relevancia y disponibilidad de los datos históricos, el grado de exactitud deseado, el período de tiempo que se desea pronosticar y el análisis costo- beneficio del pronóstico, entre otros. La elaboración de pronósticos se lleva a cabo en una diversidad impresionante de áreas que abarcan desde la familia, la escuela, hasta el gobierno y los negocios. En los negocios para obtener ventajas comerciales competitivas en un ambiente constantemente cambiante, los dirigentes de una organización deben tomar decisiones correctas en el tiempo dependiendo de la información que se tenga a la mano (R. J. Kuo et al., 1999). Sin embargo, esta decisión está orientada por rangos de tiempo que van desde muchas horas hasta muchos años dependiendo del tipo de negocio. Esto es, el tomar una decisión exacta en un tiempo adecuado, juega un papel muy importante en las organizaciones. En áreas como la mercadotecnia, los pronósticos son utilizados para estimar el tamaño del Capítulo 2. Antecedentes 9 mercado y la tendencia de precios. En finanzas es común utilizarlos en la estimación de tasas de interés, mientras que en el área de producción un uso frecuente de éstos es para estimar el crecimiento de líneas de producción. Los pronósticos pueden llegar a disminuir la incertidumbre sobre el futuro, permitiendo la elaboración de planes y campos de acción acorde a los objetivos de la organización, también permiten tomar acciones correctivas apropiadas y a tiempo cuando ocurren situaciones fuera de lo planeado. Un pronóstico es, por lo general, la base para la toma de decisiones estratégicas, tácticas y operacionales en muchas organizaciones. Dada su importancia, no es sorprendente que se haya constituido en un área activa de investigación (Makridakis and Wheelwright, 1987; Zhang, 2004). Cuando es posible obtener información cuantitativa acerca del comportamiento de la variable o fenómeno de interés a través del tiempo, es decir, cuando se dispone de una serie de tiempo, como el ejemplo que se muestra en la Figura 1.2, el pronóstico típicamente se realiza utilizando Análisis de Series de Tiempo. Existen dos tipos de procedimientos de modelación de series de tiempo que se clasifican de acuerdo a los supuestos bajo los cuales se desarrolla el modelo: procedimientos paramétricos y procedimientos no-paramétricos. Los procedimientos paramétricos son aquéllos en los cuales los parámetros del modelo tienen un significado de acuerdo a un modelo físico, químico, económico, etc. Dentro de esta clasificación se encuentran los métodos estadísticos tradicionales tales como, promedios móviles, suavizado exponencial, regresión y descomposición de series de tiempo. Estos métodos han sido ampliamente utilizados durante varias décadas y todos ellos asumen que el valor futuro de la serie de tiempo está linealmente relacionada con las observaciones pasadas. Uno de los métodos más populares es el de promedios móviles autoregresivo integrado (ARIMA), que fue popularizado por Box-Jenkins (1976). Por otro lado, los métodos no– paramétricos, son aquéllos que sólo dependen de los datos y sus parámetros están libres de interpretación o sujeción a otro modelo, tal es el caso de las RNAs. Capítulo 2. Antecedentes 10 2.2. Redes Neuronales Artificiales (RNAs) Las RNAs surgieron como una analogía de la neurona biológica mostrada en la Figura 2.1, las dendritas reciben las señales de entrada procedentes de otras neuronas a través de uniones llamadas sinapsis, el cuerpo de la neurona es llamado soma y el axón lleva la salida de la neurona a las dendritas de otras neuronas. Figura 2.1: Neurona Biológica. En general, una neurona envía su salida a otras por medio de su axón. El axón lleva la información por medio de diferencias de potencial, u ondas de corriente, que depende del potencial de la neurona. La neurona recoge las señales por su sinapsis sumando todas las influencias excitadoras e inhibidoras. Si las influencias excitadoras positivas dominan, entonces la neurona da una señal positiva y manda este mensaje a otras neuronas por su sinapsis de salida (Ghaziri , 1996). En el caso de la Neurona Artificial representada en la Figura 2.2, ésta recibe un conjunto de señales entradas y las acumula hasta alcanzar un umbral, una vez alcanzado este umbral, lo transforma mediante la función de transferencia (generalmente una función no-lineal) y envía el resultado ponderado de acuerdo a los pesos de las conexiones hacia otras neuronas. Entradas Capítulo 2. Antecedentes 11 x1 w1 x2 w2 Neurona f (w ⋅ x) t xi wi xn wn Salida V1 y Pesos multiplicativos Función de transferencia Figura 2.2: Neurona Artificial. El concepto de neurona artificial fue introducido en 1943 (McCulloch and Pitts, 1943). En la actualidad, las RNA han mostrado ser un procedimiento efectivo de propósito general para el reconocimiento de patrones, clasificación, agrupamiento y predicción (Ghiassi et al., 2005). Existen diferentes tipos de RNAs dependiendo de la forma en que se interconectan las neuronas dentro de la RNA. En pronóstico de series de tiempo, la RNA utilizada la abrumadora mayoría de las veces, es una RNA multicapa de propagación hacia adelante entrenada por retropropagación del error y con una neurona en la capa de salida. Tener una sola neurona en la capa de salida indica que solamente se predice un solo período a futuro. Esto nos da una idea del enfoque dominante en el área. De manera general, una RNA multicapa de propagación hacia adelante (Feedforward) está compuesta de tres o más capas formadas por conjuntos de neuronas que poseen características similares (Figura 2.3). La primera capa se denomina capa de entrada y es donde se recibe la información externa. La última capa es conocida como capa de salida y es donde se obtiene la solución final del problema que se esté tratando. La capa de entrada y la capa de salida están separadas por una o más capas denominadas capas Capítulo 2. Antecedentes 12 ocultas, estas capas son las encargadas de brindarle flexibilidad a la RNA para aproximar relaciones complejas entre los datos. Las neuronas en las capas adyacentes están completamente conectadas y estas conexiones van de la capa baja a la capa alta. Por ejemplo, en la Figura 2.3 se muestra una RNA multicapa de propagación hacia adelante, que contiene tres capas: una capa de entrada, una capa oculta y una capa de salida. La cantidad de neuronas en cada capa varía dependiendo de la aplicación. W V ji sj . . . . Capa de Entrada Capa Oculta . . Capa de Salida Figura 2.3: RNA multicapa de propagación hacia adelante. Antes de utilizar un modelo de RNA para que realice una tarea específica, éste necesita ser entrenado y validado. Básicamente el entrenamiento es el proceso de determinación de los pesos de las conexiones, elementos clave del modelo de RNA. El conocimiento que adquiere la RNA durante el entrenamiento es almacenado en los pesos de las conexiones. Recordemos que las neuronas transforman la información que reciben mediante la función de transferencia y la envían de manera ponderada de acuerdo a los Capítulo 2. Antecedentes 13 pesos de las conexiones hacia las neuronas con las cuales tienen conexión. Se dice que el entrenamiento es supervisado, cuando para cada vector de entrada (conocido como patrón de entrenamiento) se conoce el valor de la salida (denominado salida deseada). Los pesos de las conexiones se determinan durante el proceso de entrenamiento mediante un algoritmo que minimiza una medida del error de aproximación de la RNA. Los algoritmos de entrenamiento más comunes son los de retropropagación del error tales como Levenberg-Marquard (lm) y el de Regularización Bayesiana (br). En estos algoritmos, una vez que se conoce la salida de la RNA, se calcula el error de la aproximación con respecto al valor deseado y se propaga hacia atrás a través de las conexiones de la RNA actualizando los pesos de las mismas. Generalmente, los patrones disponibles se separan en dos subconjuntos, uno de entrenamiento y otro de validación. El subconjunto de validación ayuda a evaluar o medir la capacidad de predicción o generalización de la RNA, por un proceso que se denomina validación cruzada. En la validación se utilizan los patrones de datos que no fueron utilizados durante el entrenamiento y se calcula el error de la aproximación. Con esta información se pueden tomar medidas para evitar el sobreentrenamiento de la RNA. En resumen, el proceso de entrenamiento sirve para que la RNA adquiera conocimiento del comportamiento de los datos y la validación se utiliza para preservar la capacidad de generalización del modelo. En la literatura se ofrece poca información acerca de la selección de estos subconjuntos. Según Zhang et al. (1998), muchos autores seleccionan éstos siguiendo una regla de 90% vs. 10%, 80% vs. 20% ó 70% vs. 30%, etc. Algunos otros los seleccionan dependiendo de la aplicación que estén desarrollando, por ejemplo Granger (1993) sugirió que para modelos no lineales en pronósticos al menos el 20% de los datos deberían ser usados para validar el modelo de RNAs. De acuerdo con Zhang (2004), las RNAs se destacan porque son modelos matemáticos no lineales lo que las hace adecuadas para aproximar este comportamiento en múltiples aplicaciones. Son además modelos no paramétricos que no requieren suposiciones muy restrictivas acerca del proceso bajo el cual se están generando los datos. Por esta razón son menos susceptibles a especificaciones erróneas de un modelo que los métodos paramétricos. Esta característica de las RNAs es atractiva en la mayoría Capítulo 2. Antecedentes 14 de las situaciones de pronóstico donde los datos son fáciles de obtener pero el mecanismo de generación de los mismos no es conocido. Ha sido matemáticamente demostrado que las RNAs poseen la capacidad de aproximación universal de funciones continuas que tienen primera y segunda derivada en todo su dominio. Además muchos estudios realizados demuestran que pueden aproximar con exactitud diversos tipos de relaciones funcionales complejas (Irie and Miyake, 1988; Hornick et al., 1989; Cybenko, 1989). Esta última característica es muy importante y poderosa, ya que de cualquier modelo de predicción se espera que detecte con exactitud la relación funcional entre la variable a predecir y otros factores o variables relevantes. La combinación de modelación no lineal y aprendizaje a partir de los datos hace que las RNA’s sean una herramienta flexible de modelación general para la realización de pronósticos. A continuación se describen algunas de las aplicaciones de las RNAs para pronósticos de series de tiempo. 2.2.1. Aplicaciones de las RNAs en pronósticos de series de tiempo La idea de utilizar RNAs en pronóstico de series de tiempo data de 1964 cuando Hu aplicó una RNA lineal adaptable de Widrow para el pronóstico del tiempo (Zhang, et al., 1998). Debido a la ausencia de un algoritmo de entrenamiento para RNA multicapa en el tiempo, la investigación quedó limitada. En 1974 Werbos formuló primero la retropropagación pero no fue conocido por los investigadores en RNAs. A partir de 1986 cuando el algoritmo de retropropagación (del inglés backpropagation) fue introducido por Rumelhart et al., (1986) el desarrollo de RNAs para pronóstico de series de tiempo ha ido en incremento (Zhang et al., 1998). Werbos (1988) encontró que la RNA entrenada por retropropagación superó el desempeño de los métodos estadísticos tradicionales tales como los procedimientos de regresión y Box- Jenkins. En años recientes, las RNAs han llegado a ser extremadamente populares en el pronóstico de series de tiempo, en un gran número de áreas, incluyendo finanzas, Capítulo 2. Antecedentes 15 generación de energía, medicina, recursos del agua y ciencias ambientales, entre otras (Maier et al., 2000). Por ejemplo, han sido desarrollados modelos de RNAs para pronosticar la calidad del aire (Gardner and Dorling, 1999; Kolehmainen et al., 2001; Niska et al., 2004). Por otra parte, R.J. Kuo, et al., (1999) utilizaron datos de una cadena de supermercados de China y encontraron que un modelo de RNA como el de la Figura 2.3, supera en gran medida el desempeño del método estadístico autoregresivo de promedios móviles o ARMA. Otras aplicaciones se han concentrado en los recursos del agua, (Maier et al., 2000 ). Por ejemplo, Ashu et al., (2001) realizaron la modelación de una RNA para el pronóstico a corto plazo de la demanda de agua con el fin de que los sistemas que distribuyen este vital líquido proporcionaran un servicio eficiente. Utilizaron la RNA de propagación hacia adelante con retropropagación y utilizaron una y dos capas ocultas; los resultados de las RNAs fueron comparados con modelos estadísticos de regresión. Observaron que las RNAs encontraron pronósticos con mayor calidad que los modelos de regresión empleados. Cigizoglu (2003) utilizó un modelo de RNA para pronosticar la magnitud del flujo de un río en el este mediterráneo de Turquía, los resultados obtenidos con la RNA fueron más precisos que los encontrados con métodos de Box-Jenkins. En otra aplicación de los recursos del agua, Daliakopoulos et al., (2005) utilizaron RNAs para pronosticar el nivel de agua subterránea. Analizaron datos del valle de Messara en la parte sur de la isla de Creta en Grecia, probaron seis arquitecturas diferentes de RNAs y variaron el algoritmo de entrenamiento así como la cantidad de neuronas en la capa oculta. Encontraron que la RNA con mejor desempeño fue la RNA de propagación hacia adelante con una capa oculta, entrenada mediante el algoritmo de retropropagación de Levenberg- Marquart, utilizando 20 neuronas en la capa de entrada, 3 neuronas en la capa oculta y una en la capa de salida. Con este modelo de RNA pronosticaron hasta 18 meses adelante. A partir del pronóstico del primer período pronosticaron los siguientes mediante iteración del modelo. Capítulo 2. Antecedentes 16 Gutiérrez-Estrada et al., (2004) realizaron una comparación de un modelo de RNA contra métodos estadísticos tradicionales tales como regresión múltiple, suavizado exponencial y ARIMA, en el pronóstico de la concentración de Amonio, utilizaron datos de un criadero de peces (del inglés fishfarm) del sur de España. Probaron un modelo de RNA parecido al de la Figura 2.3, sólo que con dos capas ocultas. En promedio, la RNA realizó mejores predicciones que los métodos convencionales. Preprocesaron la información de la siguiente manera: utilizaron como datos las diferencias existentes entre períodos adyacentes y posteriormente, transformaron esas diferencias a la escala [0, 1]. El pronóstico fue de un solo período. En el área de finanzas, Qing et al., (2005) utilizaron RNAs para pronosticar el comportamiento de la bolsa de valores; los resultados que obtuvieron mostraron que las RNAs son una buena herramienta para pronosticar el precio de las acciones en mercados emergentes como China. Otro trabajo desarrollado en esta área es el desarrollado por West et al., (2005). Otra área de aplicación de las RNAs es en la predicción de demanda de algún producto o servicio. En los últimos años se ha reportado que las RNAs en la predicción de carga eléctrica han demostrado ser una de las técnicas más exitosas en esta área. González et al., (2005) pronosticaron el consumo de energía/hora en edificios. Correlacionaron las condiciones climáticas, los días y horarios, con las variaciones de carga, para predecir la carga y el consumo total en cada hora. Utilizaron una RNA de avance con tres capas y manejaron los datos en diferencias en la escala [-0.9, 0.9]. La calidad de los resultados obtenidos con el modelo de RNA fueron muy precisos, de acuerdo con su reporte. Sözen, et al., (2005) desarrollaron un modelo de RNA para pronosticar la radiación solar en Turquía, compararon los resultados con los que otros autores habían encontrado al utilizar métodos estadísticos de descomposición clásica. Su estudio confirmó que el modelo de RNA pronostica los valores de la radiación solar de manera más precisa que los métodos utilizados en estudios anteriores. Capítulo 2. Antecedentes 17 Estudios recientes acerca de la aplicación de RNAs en problemas de investigación de operaciones y negocios, incluyendo pronóstico en finanzas, se pueden encontrar en Zhang (2004) y Smith et al., (2000). En las aplicaciones mencionadas anteriormente, hacen uso de RNAs multicapa entrenadas por retropropagación del error para pronósticos a corto plazo y se limitan a utilizar RNAs con una sola neurona en la capa de salida. Sin embargo, en aplicaciones prácticas es común que se desee estimar más de un período futuro, este tipo de pronóstico se caracteriza por la incertidumbre causada por la distancia u horizonte de tiempo utilizado. Cuando se desea pronosticar múltiples períodos, muchos investigadores (Zhang et al., 1998; Hwarng, 2001; Hill et al., 1996; Nelson et al., 1999) han utilizado como recurso un modelo de RNA con una neurona en la capa de salida, como en los casos anteriores. Esta RNA se ha utilizado como base para generar pronósticos de múltiples períodos de la manera siguiente: una vez que tiene el pronóstico para el primer período, se itera el modelo considerando a éste como dato real para calcular el pronóstico del segundo periodo, y así sucesivamente hasta alcanzar el horizonte de planeación deseado. Esta técnica obviamente trae consigo la desventaja de propagar el error de cada uno de los pronósticos a lo largo de todos los períodos que le siguen. Esto es, si en el pronóstico del primer período se tuvo un error grande, éste afectará el pronóstico del segundo período y éste a su vez el del tercero y así sucesivamente. En otras palabras, un mal pronóstico generado en los primeros períodos podría afectar de manera adversa los pronósticos de los últimos períodos. Una técnica utilizada por Duhoux et al., (2001) es utilizar cadenas de RNAs. Esta técnica consiste en utilizar n RNAs simples, con diferentes tamaños del vector de entradas que van desde 1 hasta n. La entrada de una RNA será la misma que la entrada de la RNA anterior más el valor pronosticado por la RNA anterior. Las desventajas que reportaron en cuanto al uso de este método son que: 1) El modelo requiere un número muy grande de RNAs y de datos y 2) el conocimiento adquirido en un modelo de RNA no es usado para la construcción del siguiente modelo. Capítulo 2. Antecedentes 18 Otra técnica comúnmente utilizada para el pronóstico de múltiples períodos es la creación de RNAs independientes para cada horizonte de pronóstico deseado, es decir, se crean modelos de RNAs independientes, uno para pronosticar el valor de la serie en el primer período, otro para pronosticar el del segundo período, otro para el pronóstico del tercero, y así para cada uno de los períodos. Este método tiene la ventaja de no propagar el error de cada pronóstico hacia los que le siguen, sin embargo se tendrían varios modelos independientes, desarrollados y seleccionados de manera diferente, dependiendo del horizonte de pronóstico. Hanh et al., (2004) utilizan esta técnica para pronóstico de series de tiempo con horizonte de planeación largo, utilizando series de tiempo de la demanda de gas en una estación compresora en Saskatchewan, Canadá. Los resultados obtenidos fueron comparados contra un modelo iterativo y observaron que crear múltiples RNAs, una para cada horizonte de planeación resultó con mejor aproximación que utilizar un modelo simple en el que consideran como dato real el pronóstico calculado en el o los períodos anteriores. Una técnica más de RNAs para el pronóstico de múltiples períodos es crear un solo modelo que simultáneamente genere los pronósticos de múltiples períodos, es decir, una RNA con múltiples salidas. Este método, se espera que conduzca a mejores resultados (Zhang, 2004) que las técnicas descritas anteriormente, sin embargo, aún no está teóricamente demostrado. Tenemos poco conocimiento de trabajos desarrollados con la aplicación de esta técnica. A pesar de que son numerosas las aplicaciones desarrolladas mediante RNAs para pronóstico de series de tiempo y que los resultados han sido satisfactorios, no ha sido posible estandarizar una metodología que garantice la construcción de modelos de RNAs con buen desempeño. El desempeño de la RNA está determinado por la exactitud del pronóstico y ésta depende de varias decisiones sumamente importantes en cuanto a la definición de los parámetros que intervienen en el modelo. Estas decisiones se discuten a continuación. Capítulo 2. Antecedentes 19 2.2.2 Decisiones en la aplicación de RNAs para pronósticos de series de tiempo Dentro de las decisiones críticas en la construcción de una RNA multicapa (ver Figura 2.3) para pronósticos de series de tiempo se encuentran la especificación de la arquitectura en términos de la cantidad de variables de entrada (el número de neuronas en la capa de entrada), así como el número de neuronas en la capa oculta y en la capa de salida (Qi et al, 2001). Al determinar el número de neuronas en la capa de entrada, se determina la cantidad de datos históricos que se deben utilizar para la realización del pronóstico. En este documento, a los datos históricos se les denominará con el término en inglés lags. Así mismo, es bien sabido que el número de neuronas en la capa oculta determina la capacidad de la RNA para aproximar las relaciones no lineales entre los lags y las variables de salida o pronósticos (Zhang et al., 1998). La selección de número de neuronas en la capa oculta ha sido anteriormente estudiada por diversos autores (Zhang, 2004; Hansen et al., 2003; Sexton et al., 2005), sin embargo, no existe aún una manera definitiva para abordar este problema. Otra decisión implica determinar si se preprocesan los datos o no. Son numerosas las aplicaciones de RNAs en las que los autores aconsejan el preprocesamiento de los datos para mejorar el desempeño de la RNA. Por ejemplo, Piramuthu et al. (1998) documentan la importancia del mismo. Se ha observado que al construir nuevas representaciones de los datos se pueden atenuar las dificultades durante la fase de entrenamiento, en la que la RNA trata de aprender (representar) los datos que se le presentan. El preprocesamiento reduce el grado de dispersión y complejidad de los datos en el espacio de búsqueda bajo el cual se lleva a cabo el entrenamiento (Hansen et al., 2003) y es por tanto un factor importante si se busca mejorar el desempeño de la RNA. Por otra parte, seleccionar el algoritmo de entrenamiento que se utilizará para modificar los pesos de las conexiones de la RNA es otro factor importante para la gran mayoría de aplicaciones de RNAs. Pronósticos de series de tiempo en este caso, no es la excepción. Capítulo 2. Antecedentes 20 Para la selección de los parámetros que intervienen en el modelo de RNA, algunos autores utilizan prueba y error; otros más han utilizado algoritmos genéticos o procedimientos híbridos, sin embargo existe poca información y evidencia acerca de la efectividad de los mismos. Por ejemplo, Liao et al., (2005) proponen un procedimiento para la selección de parámetros de la RNA que consiste en tres etapas, en cada una de ellas fijan algunos de los parámetros y utilizan un diseño de experimentos. La desventaja en este método es que en cada etapa se ajusta uno de los parámetros, es decir, el ajuste se realiza de manera independiente ignorando por completo la posible interacción entre los diferentes parámetros del modelo. En este trabajo se propone que la selección de los parámetros de RNA para pronóstico de series de tiempo se realice de una manera sistemática y consistente por medio de la utilización de métodos estadísticos experimentales y técnicas de optimización siguiendo la metodología que se describe en el siguiente capítulo. La información relevante en cuanto al diseño de experimentos se presenta a continuación. 2.3. Análisis y Diseño de Experimentos El Diseño y Análisis de Experimentos (ADE) es una colección de herramientas estadísticas que se relacionan con la planeación, la ejecución y la interpretación de un experimento. Tiene como objeto estudiar los efectos de variables de interés dispuestas en varios niveles en una o varias respuestas cuantificables. Sir Ronald A. Fisher introdujo los principios básicos de ADE en las décadas de 1920 y 1930 en el área agrícola (Montgomery 2004; Martínez 1988). De manera general, un experimento se puede definir como una prueba planeada donde se introducen cambios controlados en las variables de entrada de un proceso o sistema con el objetivo de analizar la variación inducida por estos cambios en una repuesta o salida (Montgomery, 2004). Un proceso o sistema puede ser visto como el modelo representado en la Figura 2.4. Capítulo 2. Antecedentes 21 El diseño de experimentos se ha aplicado en diversas disciplinas, puede considerarse como parte del conocimiento científico y es uno de los medios más utilizados para conocer el funcionamiento de procesos y sistemas. En general, un proceso puede ser visto como una combinación de máquinas, métodos, personas u otros recursos que transforman ciertas entradas (con frecuencia un material) en una salida que tiene una o más respuestas observables. Algunas variables son controlables, mientras que otras no lo son. Factores Controlables x1 x 2 ... x n −1 xn PROCESO Entradas z1 z 2 ... z m −1 Salidas, y zm Factores no Controlables Figura 2.4: Modelo general de un proceso o sistema. Cuando se planea o ejecuta un experimento es siempre recomendable usar el conocimiento no-estadístico del sistema para complementar el proceso de experimentación, así como para mantener el tamaño y la concentración del experimento dentro de límites adecuados. En muchos experimentos interviene el estudio de los efectos de dos o más factores, en general los diseños factoriales son muy recomendables para este tipo de análisis. Capítulo 2. Antecedentes 22 El diseño factorial es una estrategia de experimentación en la que en cada réplica del experimento se estudian todas las combinaciones posibles de un número determinado de valores de cada factor. Al número determinado de valores que toma cada factor se les llama niveles. Por ejemplo, si tenemos el factor A y el factor B, cada uno con dos niveles, cada réplica experimental contiene 22 combinaciones, a cada nivel le corresponde un valor específico del factor. El efecto de un factor se define como el cambio en la respuesta o medida de desempeño producido por un cambio en el nivel del factor. En algunos experimentos puede encontrarse que la diferencia en la respuesta entre los niveles de un factor no es la misma para todos los niveles de otro factor, a esto se le llama interacción entre factores. Cuando los factores del diseño de experimentos son cuantitativos, una representación del experimento se puede realizar mediante un modelo de regresión en el que las variables independientes representan los factores del experimento, la variable dependiente corresponde a la medida de desempeño o respuesta y la estimación de los parámetros del modelo de regresión están relacionados con la estimación de los efectos de los factores en la medida de desempeño. Para la estimación de parámetros generalmente se utiliza el método de mínimos cuadrados. Información más completa acerca del análisis y diseño de experimentos se puede encontrar en Montgomery (2004). Se puede utilizar el análisis y diseño de experimentos para caracterizar la variación de un sistema y para obtener modelos empíricos como la regresión descrita anteriormente. Estos modelos pueden después utilizarse para llevar a cabo la optimización. En la siguiente sección se abordan aspectos básicos del área de optimización. 2.4. Optimización En la gran mayoría de aplicaciones prácticas en la ciencia y la ingeniería se emplean modelos matemáticos para representar un sistema o proceso de interés con el fin de estudiar y entender el funcionamiento del mismo. Podemos decir que un modelo es un Capítulo 2. Antecedentes 23 conjunto de relaciones matemáticas que representan una abstracción del sistema real en consideración. De acuerdo con Floudas (1995), un modelo matemático consta de tres elementos clave: variables, parámetros y restricciones o relaciones matemáticas. Las variables pueden tomar diferentes valores y sus especificaciones determinan diferentes estados del sistema. Representan las decisiones que se pueden tomar para afectar el rendimiento del sistema, por ejemplo, la cantidad de producto a fabricar o vender, la cantidad de materia prima, etc. Estas pueden ser continuas, enteras o mixtas (combinación de continuas y enteras). Los parámetros se fijan a valores específicos y cada especificación determina un modelo diferente. Las relaciones matemáticas pueden ser clasificadas en igualdades, desigualdades y condiciones lógicas. Usualmente las igualdades son utilizadas para representar los balances de masa y energía; relaciones de equilibrio, cálculos de propiedades físicas y relaciones de diseño que describen el sistema físico. Las desigualdades generalmente representan la asignación de recursos, los límites de capacidad disponible y demanda. Mientras que las condiciones lógicas proveen las conexiones de este tipo entre las variables continuas y las variables enteras. Las relaciones matemáticas pueden ser algebraicas, transcendentes, o una mezcla de algebraicas y trascendentes; pueden ser lineales o no lineales. Una relación es trascendente cuando contiene expresiones trigonométricas, exponenciales o logarítmicas. Un problema de optimización, además de tener las características de un modelo matemático, cuenta con uno o múltiples criterios que representan el desempeño del sistema o proceso. El criterio de desempeño denota la función objetivo del problema de optimización. La función objetivo representa una medida de desempeño cuantificable que se quiere ya sea maximizar o minimizar. Por ejemplo, en general los costos representan una medida de desempeño que se desea minimizar y las ganancias una medida que se quiere maximizar. La formulación (2.1) es la representación general de un problema de minimización. Capítulo 2. Antecedentes 24 min f(x) s.a h(x) = 0 (2.1) g(x) ≤ 0 x ∈ X ⊆ ℜn Si cualquiera de las funciones f ( x), h( x), g(x) es no lineal, entonces la formulación (2.1) es llamada problema de optimización no lineal. Las funciones f ( x), h( x), g(x) pueden tomar cualquier forma de no linealidad. Este tipo de problemas abundan en un gran número de aplicaciones en diversas áreas tales como diseño y control de procesos químicos, localización de facilidades, diseño de redes, diseño de circuitos electrónicos entre otras. Una vez que se tiene el problema de optimización se procede a resolverlo con el fin de encontrar la mejor solución que cumpla con el conjunto de restricciones. Al conjunto de soluciones que cumplen con el conjunto de restricciones se les conoce como soluciones factibles y la mejor de ellas es conocida como solución óptima. Lo deseable es encontrar la solución óptima, sin embargo muchas veces esto no es posible dadas las características de los problemas. Estas características en general tienen que ver con convexidad. Se dice que un conjunto S ∈ E n es un conjunto convexo si para cualesquiera dos puntos x 1 , x 2 ∈ S se satisface que λ x 1 + ( 1 − λ ) x 2 ∈ S para cada λ ∈ [ 0 ,1 ] . Ahora bien, sea S un conjunto convexo, se dice que f ( x ) es convexa si y sólo si se satisface (2.2) para cualquier x 1 , x 2 ∈ S y 0 ≤ λ ≤ 1 . f [( 1 − λ ) x 1 + λ x 2 ] ≤ (1 − λ ) f ( x 1 ) + λ f ( x 2 ) (2.2) Capítulo 2. Antecedentes 25 En la Figura 2.5, podemos observar gráficamente lo que sería a) una función convexa; b) una función estrictamente convexa y en la Figura 2.6 se representa una función no convexa. b) a) Figura 2.5: a) Función convexa y b) Función estrictamente convexa. Figura 2.6: Función no convexa. Capítulo 2. Antecedentes 26 Más aún, decimos que f ( x ) es estrictamente convexa si y sólo si se cumple estrictamente el sentido de la desigualdad (2.2) para todo x1 , x 2 ∈ S tal que x 1 ≠ x 2 y 0 < λ < 1 . Si x * ∈ S y satisface (2.3) ∀ x ∈ S , decimos que x * es un mínimo global. f (x*) ≤ Si x * f (x) ∈ S y existe un entorno V ( x ∀ x ∈ S ∩ V (x * ) , se dice que x * * (2.3) ) tal que se satisface (2.3) es un mínimo local. La función f ( x ) estrictamente convexa tiene a lo más una solución óptima, lo cual garantiza optimalidad global (Borwein, et al., 2000; Floudas, 1995). Nótese que, si f ( x ) es convexa podemos encontrar rápidamente una solución óptima global, pero si no lo es, es posible tener varias soluciones óptimas locales. Estas provocan que los métodos utilizados para resolver el problema se queden atrapados en ellas reduciendo la posibilidad de encontrar una solución óptima global. Existen varias referencias de consulta para el área de optimización, dentro de las que se encuentran Borwein et al., (2000), Floudas (1995) y Luenberger (1973). Cuando se tienen múltiples criterios en un problema de optimización, el problema se clasifica como de optimización multicriterio. En la práctica es muy común la existencia de este tipo de problemas. Por ejemplo, en muchas empresas se pretende maximizar la calidad de un producto y minimizar su costo de producción simultáneamente. Ésto implica un conflicto. Existen diversas técnicas que se han desarrollado con el fin de resolver este tipo de problemas. Capítulo 2. Antecedentes 27 Las técnicas de optimización multicriterio tienen como objetivo encontrar aquellas soluciones que representen los mejores compromisos entre todas las medidas de desempeño, las cuales se denominan soluciones eficientes. Una representación gráfica Objetivo 2. Maximizar conveniente se puede encontrar en la Figura 2.7. Objetivo 1. Minimizar Figura 2.7: Representación Gráfica de un Problema de Optimización Multicriterio. La línea mostrada une soluciones eficientes y delimita la frontera eficiente del problema. Dado que no es el objetivo en este trabajo discutir a fondo técnicas multicriterio, se refiere al lector interesado a Deb (2004) y a Hillermeier (2001) para ahondar en el tema. Una de las técnicas que se ha propuesto recientemente para resolver este tipo de problemas es el análisis envolvente de datos. Algunas aplicaciones en el terreno de la manufactura se pueden encontrar en Cabrera-Ríos et al. (2002,2004), Castro J. M. et al. (2004) y en Castro C. E et al. (2003). CAPÍTULO 3 METODOLOGÍA PROPUESTA Introducción Desarrollar un modelo de RNAs para una aplicación particular de pronóstico no es una tarea trivial. Aunque en la actualidad existen herramientas computacionales que ofrecen a los usuarios la construcción de modelos de RNAs de una manera fácil y rápida, continúa siendo un reto la comprensión de muchos factores que determinan la efectividad de un modelo de RNAs. Zhang (2004) llega a afirmar que la construcción de una RNA efectiva es una combinación de arte y ciencia. En este capítulo, se propone una metodología basada en el análisis estadístico y optimización de las medidas de desempeño de la RNA, que son esencialmente definidas para nuestros propósitos como medidas del error de predicción. El método consiste en diseñar y analizar un experimento estadístico en el que cada factor o variable controlable corresponde a uno de los parámetros que se desea ajustar en la RNA. Se caracterizan los resultados mediante un análisis de varianza basado en un modelo de regresión apropiado para cada medida de desempeño. Posteriormente, se considera cada uno de los modelos de regresión como la función objetivo de un problema de optimización en el que se 28 Capítulo 3. Metodología Propuesta 29 busca el valor de los parámetros que minimizan el valor objetivo de la medida de desempeño. La solución final determina el valor que deben tomar los parámetros para que el modelo de RNAs encuentre pronósticos confiables. 3.1 Descripción de la Metodología La Figura 3.1 representa esquemáticamente la metodología que se propone con el objetivo de seleccionar los parámetros del modelo de RNAs de una manera sistemática y consistente. La metodología aquí se presenta de una manera general para RNAs. En los capítulos posteriores se discutirán los detalles de su aplicación en pronósticos de series de tiempo. Dentro de las características atractivas de la metodología se encuentra que: (1) utiliza técnicas establecidas y confiables, (2) puede instaurarse sin necesidad de una codificación especializada y (3) hace entendible la interrelación entre los varios parámetros de la RNA. Esta metodología surgió con la idea básica de ver la RNA como un sistema en el cual existen variables controlables que influyen en una de sus medidas de desempeño. De esta forma, al considerar los parámetros de la RNA como variables controlables que influyen en el desempeño de la misma, podemos variar estos parámetros para formar la superficie de respuesta del error de predicción de la RNA y así construir un modelo de regresión que relacione parámetros y error de predicción. Con este conocimiento es posible, en caso que sea necesario, eliminar variables que no sean estadísticamente significativas, caracterizar interacciones, así como determinar si las medidas de desempeño seleccionadas acerca de la RNA dependen de conjuntos de variables distintos entre sí. En este último caso, es factible crear problemas independientes de optimización para distintas medidas de desempeño. Capítulo 3. Metodología Propuesta 30 Parámetros Tipo de RNA 1) Descripción de la RNA como Sistema. Respuestas 2) Análisis y Diseño de Experimentos. Caracterización 3) Metamodelación 4) Problemas de Optimización. Múltiples Inicializaciones 5) Solución Figura 3.1: Metodología Propuesta para la Selección de Parámetros en RNAs. Dado que nuestro objetivo final es determinar qué valores deben tomar los parámetros para obtener un valor deseable en las medidas de desempeño de la RNA, el problema se convierte en uno de optimización. Capítulo 3. Metodología Propuesta 31 Los pasos de la metodología propuesta en la Figura 3.1 se pueden describir de la manera siguiente: 1) Descripción de la RNA como Sistema. Determinación del tipo de RNA que se utilizará para el análisis. El tipo de RNA está determinado por la manera en que se interconectan las neuronas en la red, suele conocerse con el nombre de topología o arquitectura de la RNA. Existe una diversidad impresionante de arquitecturas de RNAs, que han sido desarrolladas, estudiadas y utilizadas en diversas aplicaciones. Las RNAs más comunes son las redes por capas, las redes recurrentes y las redes de conexión lateral (Ghaziri, 1996). En el caso de RNAs para pronósticos de series de tiempo, la más utilizada es la RNA multicapa, representada en la Figura 2.3. Identificación de los parámetros controlables. Una vez que se ha seleccionado el tipo de RNA que se utilizará para la aplicación, es necesario identificar aquellos parámetros que afectan el desempeño de la RNA con el fin de asignarles un valor que permita la obtención de una RNA confiable. Definición de las respuestas de interés (medidas de desempeño de la RNA). Las respuestas de interés o medidas de desempeño de la RNA suelen ser medidas que cuantifican el error de aproximación. Las más comunes son el Error Absoluto Medio o MAE y el Error Cuadrado Medio o MSE. La aplicación y los intereses del usuario determinan la selección de la medida de desempeño. Capítulo 3. Metodología Propuesta 32 2) Análisis y Diseño de Experimentos. Para llegar a la definición de la metodología propuesta de la Figura 3.1, se partió del hecho de que un experimento puede ser visto como una prueba planeada donde se introducen cambios controlados en un proceso o un sistema con el objetivo de analizar la variación inducida por estos cambios en una medida de desempeño. En varios casos y dada la rapidez relativa con la que se pueden entrenar las redes neuronales, será factible escoger un diseño factorial. Este diseño contiene tantas corridas experimentales como combinaciones de niveles resulten para los factores, esto es, si existen cuatro factores variados a tres, cuatro, tres y cinco niveles cada uno, el diseño factorial tendrá 3x4x3x5 = 180 corridas experimentales. De esta manera, los factores controlables que intervienen en el experimento corresponden a los parámetros del modelo de RNA que se desean determinar. Cada corrida experimental indica los valores asignados a los parámetros para construir la RNA correspondiente y bajo los cuales se llevará a cabo el entrenamiento y validación de la misma. Una vez realizado el entrenamiento, se cuantifica la calidad de predicción de la RNA a través de las medidas de desempeño seleccionadas para el estudio y se registra como parte del experimento. En los parámetros donde sea posible considerar tres o más valores diferentes, es recomendable utilizar al menos tres de esos valores, con el fin de estimar curvatura. Con el objetivo de caracterizar la variación producida por los parámetros en las medidas de desempeño del modelo de RNA, requerimos hacer un análisis de varianza basado en un modelo de regresión lineal múltiple de segundo orden con interacción, similar al de la Ecuación (3.1), bajo el supuesto de que los residuos ε , son independientes e idéntica y normalmente distribuidos con una varianza desconocida pero constante. Capítulo 3. Metodología Propuesta 33 3) Metamodelación. En esta fase se describe la superficie de cada respuesta (medida de desempeño) mediante un modelo de regresión apropiado, sin dejar a un lado la comprobación de los supuestos descritos anteriormente. La formulación del modelo de regresión utilizado es la siguiente: k k i =1 i =1 k −1 y = β 0 + ∑ β i x i + ∑ β ii x i + ∑ 2 k ∑β i =1 j = i +1 ij xi x j + ε (3.1) La variable dependiente y representa el valor de la medida de desempeño de la RNA, xi corresponde al valor que toma el parámetro i en cada combinación factorial, β0 representa la ordenada al origen del plano de regresión, β i corresponde al coeficiente de regresión de xi , β ii es el coeficiente de regresión de xi2 y β ij es el coeficiente de regresión de la interacción de entre xi y x j , ∀(i < j ) ; k es el número de parámetros controlables. Los coeficientes de regresión son típicamente calculados mediante un procedimiento de reducción de errores cuadrados, disponible en la mayoría de paquetes computacionales de estadística comerciales. A este procedimiento suele llamársele “ajuste del modelo”. Una vez calculados los coeficientes de regresión se realiza la comprobación de supuestos para verificar la adecuación del modelo. A través del análisis de residuos se comprueba la independencia estadística, la normalidad y la varianza constante en los residuos. Entiéndase como residuo, la diferencia que existe entre el valor de la medida de desempeño obtenida en la experimentación y el valor que se obtiene mediante el modelo de regresión en cada una de las combinaciones factoriales. El análisis de residuos se puede llevar a cabo Capítulo 3. Metodología Propuesta 34 inicialmente a través de una serie de gráficas. Si se detecta algún problema en esta fase, entonces se utilizan pruebas formales estadísticas de hipótesis para comprobar las conclusiones. 4) Problemas de Optimización. Para llevar a cabo la optimización, los metamodelos (modelos de regresión) obtenidos en la fase anterior se usan aquí como funciones objetivo de un problema de optimización. Se construye un problema de optimización para cada medida de desempeño. Como se muestra en la formulación (3.2), la función objetivo z estará definida por el metamodelo que se encontró para la correspondiente medida de desempeño y el objetivo final será encontrar los valores de los parámetros que minimizan el valor de la función objetivo. En general, los problemas de optimización resultantes tienen la formulación 3.2. ∀i∈ I Encontrar xi Minimizar z = β0 + Sujeto k ∑ i =1 para β i xi + k ∑ i =1 β ii x i 2 + k −1 k i =1 j = i +1 ∑ ∑ β ij x i x j (3.2) a x li ≤ x i ≤ x ui xi ∈ Z + ∀i∈ I ∀i∈ I I = {1 , 2 ,..., k } Las variables de decisión son las variables xi , representan el i-ésimo parámetro que se busca para minimizar la función objetivo z . Como ya se mencionó anteriormente, la función objetivo corresponde al modelo de regresión que describe la medida de desempeño en cuestión; k es el número de parámetros controlables, dichos parámetros están acotados por un valor mínimo x li y un valor máximo xui que deben ser Capítulo 3. Metodología Propuesta 35 especificados con anterioridad en la fase de Análisis y Diseño de Experimentos. La última restricción indica que las variables xi pueden tomar solamente valores enteros y positivos. 5) Solución Esta fase consiste en resolver los problemas de optimización definidos en el paso anterior mediante el uso de algún optimizador. El problema de optimización (ver formulación 3.2), para cada medida de desempeño es no lineal la gran mayoría de las veces y las variables de optimización xi son enteras. Estas características hacen que el problema de optimización sea difícil de resolver. Más aún, estos problemas suelen ser no convexos, en cuyo caso no se puede garantizar que la solución final sea una solución óptima global. Un problema no convexo, nos lleva a la presencia de múltiples soluciones que son óptimas localmente, así que se corre el riesgo de estancarse en la peor de ellas y tomarla como solución final debido a que un optimizador local no pudo encontrar una mejor solución que ésta. Con el propósito de evitar lo anterior, se parte de múltiples soluciones iniciales para resolver el problema, se registran cada una de las soluciones encontradas y al final se selecciona la mejor de ellas para entregarla como solución final. Una vez que se han resuelto los problemas de optimización de manera independiente, se analizan las soluciones encontradas por el optimizador. Si la solución final es la misma para todos los problemas, significa que las medidas de desempeño están correlacionadas pues lo que minimiza a una también minimiza a las otras. En caso que las soluciones finales encontradas para cada uno de los problemas de optimización sean diferentes, se implementa una técnica de optimización multicriterio para dar un abanico de soluciones que represente el mejor compromiso en las medidas de desempeño de la RNA. A estas soluciones se les llama “eficientes”. De este conjunto de soluciones, el usuario elige una. Capítulo 3. Metodología Propuesta 36 Cuando se sigue esta metodología, la solución final a la que se llega indica en qué valores deben colocarse los parámetros de la RNA para que ésta garantice la obtención de pronósticos confiables con bases estadísticas sólidas. Se probó inicialmente la metodología aquí descrita en el estudio de un caso práctico de pronóstico de demanda de un solo período en la industria de telecomunicaciones, este caso se describe en el Capítulo 4. En el Capítulo 5 se explica a detalle el diseño de una RNA de múltiples períodos siguiendo esta misma metodología. CAPÍTULO 4 PRONÓSTICO DE SERIES DE TIEMPO DE UN SOLO PERÍODO Introducción Los pronósticos de series de tiempo constituyen un área activa para la aplicación de Redes Neuronales Artificiales (RNAs). Aunque la selección de una RNA para tal aplicación se ha simplificado grandemente, la falta de un método establecido para asignar los parámetros de las RNAs de una manera adecuada sigue siendo un reto. En el Capítulo 3 se propuso una metodología basada en técnicas estadísticas y optimización para la selección de parámetros de una RNA. La comprobación de esa metodología se realizó al aplicarla en el desarrollo de un modelo de RNA para pronóstico de demanda en telecomunicaciones. Este modelo se construyó tomando como base la RNA presentada en la Figura 2.3 por su bien conocida capacidad de aproximación universal (White, 1990; Hornik, 1989), su amplia utilización y el buen desempeño que ha mostrado en el análisis de series de tiempo (Zhang, et al., 1998; Zhang, 2004; Liao et al., 2005; Hansen, et al., 2004). 37 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 38 En el presente Capítulo se describe la aplicación de la metodología descrita en el Capítulo 3. En la Sección 4.1 se da una descripción detallada del problema en la industria de telecomunicaciones, la Sección 4.2 contiene la ejecución de la metodología para la selección de los parámetros del modelo de RNA explicada paso a paso así como los resultados obtenidos. Finalmente, se muestran las conclusiones del Capítulo. 4.1. Pronóstico de Demanda en telecomunicaciones En la empresa de este caso, se tiene la necesidad de estimar el comportamiento de la demanda para el siguiente período con el fin de prever la capacidad necesaria en la red de transmisión que permita la satisfacción total de la demanda. La capacidad requerida en la red de transmisión está directamente relacionada con la utilización de ésta a lo largo del tiempo. Podemos decir entonces que en nuestro caso, la variable de interés es la demanda de un servicio, que implica la utilización de la red de transmisión. La empresa cuenta con equipo especializado que lleva un registro de la cantidad de tráfico que pasa a través de cada nodo de la red de transmisión. Los registros de la utilización de la red se realizan mensualmente, por tanto contamos con información histórica o serie de tiempo del comportamiento de la demanda. Tal comportamiento se muestra en la serie de tiempo de la Figura 4.1. Una vez que se tiene la serie de tiempo, se procede al análisis de la misma con el fin de construir un modelo que aproxime el comportamiento de la demanda con exactitud y de esa manera nos permita pronosticar de manera confiable el valor de la demanda en períodos posteriores. Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 39 800 Unidades de Demanda 700 600 500 400 300 200 100 0 1 7 13 19 25 31 37 43 49 55 61 67 Tiempo (meses) Figura 4.1: Serie de tiempo del comportamiento de la demanda. Como se mencionó anteriormente, existen diversas metodologías que nos permiten llevar a cabo el análisis de series de tiempo, sin embargo, la gran mayoría son métodos lineales. Como se verá en el Capítulo 6, tales métodos no son los más adecuados para nuestro caso debido a la presencia de no linealidad. Las relaciones no lineales en los datos se encuentran en varias aplicaciones prácticas y es por tanto necesario utilizar técnicas capaces de reflejar tal comportamiento. Las RNAs proveen una herramienta alternativa para la realización del análisis y pronóstico debido a su capacidad de modelar esta no linealidad. Por otro lado, incluso cuando el caso es uno de linealidad, las RNAs han mostrado ser exitosas y competitivas como herramientas de modelación (Hwarng, 2001; Medeiros et al., 2001; Zhang, 2001). Por esta razón, optamos por desarrollar un modelo de RNA para pronósticos de series de tiempo. A continuación se describe la construcción del modelo. Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 40 4.2. Construcción del Modelo de RNA para Pronóstico de Series de Tiempo de un solo período Teniendo como principal objetivo comprobar la metodología descrita en el Capítulo 3, consideramos la serie de tiempo de la Figura 4.1 con el fin de desarrollar un modelo de RNA como el de la Figura 4.2 para predecir el valor de la demanda del siguiente período. 4.2.1. Descripción de la RNA como Sistema Determinación del tipo de RNA que se utilizó para el análisis. Para la construcción del modelo se utilizó la RNA representada en la Figura 4.2. Ésta es una red neuronal similar a la mostrada en la Figura 2.3, con la excepción de que en este caso es para un modelo de pronósticos. Cuenta con tres capas de neuronas: una capa de entrada en la que se recogen datos conocidos, una capa oculta que determina la flexibilidad de la RNA para adaptarse a los datos conocidos y una capa de salida, por medio de la que se obtiene la salida de la red, es decir el valor del pronóstico. En esta RNA específica, se considera solamente una neurona en la capa de salida, la variable neuronas determina la cantidad de neuronas en la capa oculta y la cantidad de datos históricos (lags) determina la cantidad de neuronas en la capa de entrada. En la Figura 4.2, las entradas Yi para i = t − m, t − m + 1,...t presentadas a la RNA, corresponden a los valores de la demanda registrada en m períodos anteriores (lags) al período t + 1 . Estas son propagadas hacia delante a través de las capas y el vector de salida de cada neurona es calculado mediante la función de transferencia, este función debe ser continua, diferenciable y acotada. En nuestro caso, las funciones de transferencia utilizadas fueron la tangente hiperbólica (Ecuación 4.2) en las neuronas de la capa oculta y la función identidad (Ecuación 4.3) en la neurona de la capa de salida (que en este caso es una neurona). De esta manera, el patrón de entrenamiento o Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 41 bien de validación está formado por un conjunto de datos históricos (lags) que llevan asociado un valor futuro deseado (target). ∧ Capa de Salida Y t +1 bt+1 Vt+1,i Capa Oculta ……… bj Wji Capa de Entrada …... Yt Yt-1 Yt-m+1 Yt-m Figura 4.2: Red Neuronal Artificial de propagación hacia adelante, entrenada por retropropagación del error de pronóstico, con tres capas. En W ji la mostrada para i = 1,2,..., neuronas , conexión Vt +1,i RNA que llega a la para j = 1,2,..., m neurona j la Figura corresponde procedente de al la peso neurona 4.2, de la i , para i = 1,2,..., neuronas es el peso de la conexión que llega a la neurona t + 1 (neurona de salida) desde la neurona bj en como j (neurona de la capa oculta). Tanto bt +1 son conocidos como umbrales (del inglés ‘biases’), y representan el umbral de la neurona j (en la capa oculta) y el umbral de la neurona t + 1 en la capa de salida respectivamente. Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 42 La neurona en la capa de salida calcula el pronóstico de la demanda en el período ∧ t + 1 y está representado por Y t +1 . La representación matemática de la RNA es la descrita en la Ecuación (4.1). ∧ ⎡m ⎛ ⎤ ⎛ neuronas ⎞⎞ Y t +1 = g ⎢∑ ⎜⎜Vtj × f ⎜ ∑ W jiYi + b j ⎟ ⎟⎟ + bt +1 ⎥ ⎢⎣ j =1 ⎝ ⎥⎦ ⎝ i =1 ⎠⎠ (4.1) Donde: e x + e −x f ( x) = x e − e −x y g ( x) = x (4.2) (4.3) Identificación de los parámetros controlables. Determinar la cantidad de datos históricos lags que se utilizarán para el desarrollo de un modelo de RNA para pronóstico es muy importante puesto que nos indica hasta qué período en el pasado es significativa la correlación entre los datos. El número de neuronas en la capa oculta brinda a la RNA la capacidad de aproximar las relaciones no lineales existentes entre los datos. Por esta razón, debe ser seleccionado con cuidado pues un número excesivo de neuronas provoca demasiada flexibilidad al modelo que puede traducirse en el fenómeno de pérdida de la capacidad de predicción de la red conocida como sobreentrenamiento. Para llevar a cabo el entrenamiento por retropropagación del error, es decir la actualización de pesos de las conexiones entre las neuronas, así como la actualización Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 43 de los umbrales en las neuronas de la capa oculta y en la neurona de la capa de salida, existe una diversidad de algoritmos. En este caso utilizamos el algoritmo de LevenbergMarquard (lm) y el de Regularización Bayesiana (br). Ambos son conocidos como procedimientos de segundo orden que han demostrado efectividad en el entrenamiento de RNAs (Bishop, 1995; Hagan et al., 1996; Sözen et al., 2005; Daliakopoulos et al., 2005). En cuanto al manejo de los datos se consideraron los parámetros transfomación y escala; transformación incluyó dos opciones: manejar los datos como demanda puntual en cada período o como diferencias entre la demanda de períodos adyacentes; por otro lado, escala se refiere a normalizar los datos para que caigan en una escala de [-1, 1] o bien manejarlos en su escala original. Son varias las aplicaciones en las cuales los autores aconsejan el manejo de datos en diferencias y normalizados (Hansen et al., 2003; Cigizoglu 2003; Gutiérrez-Estrada et al., 2004; González et al., 2005), pues han visto que la RNA tiene mejor desempeño. Entonces, para determinar si en nuestro caso es importante el preprocesamiento de datos, consideramos los parámetros transformación y escala. En resumen, los parámetros considerados fueros: neuronas, lags, escala, transformación y algoritmo Definición de las respuestas de interés (medidas de desempeño de la RNA). Para medir la calidad del pronóstico (medidas de desempeño) de la RNA se utilizaron el Error Cuadrado Medio o MSE (Ecuación 4.4); el Error Absoluto Medio o MAE (Ecuación 4.5); la mayor de las diferencias en las que el valor del pronóstico de la RNA está debajo del valor deseado (target) lo denominamos como B_Pred (Ecuación 4.6); y S_Pred (Ecuación 4.7) es la mayor de las diferencias en las que el valor del pronóstico de la RNA está arriba del valor deseado. Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 44 Tanto MSE como MAE son medidas de desempeño que han sido muy utilizadas en la literatura, mientras que B_Pred y S_Pred son medidas que en nuestro caso de estudio resultaron importantes para determinar por una parte, el peor caso de demanda insatisfecha y por otra parte, el peor caso de capacidad ociosa en la red. Llamémosle l a la cantidad de patrones de entrenamiento, sea y j el valor deseado ∧ para j = 1,2,...l y sea y j la salida (pronóstico) de la (target) asociado al patrón j RNA. A continuación se muestran las ecuaciones correspondientes a las medidas de desempeño utilizadas. MSE = MAE = 1 l ∧ ∑ ( y j − y j )2 l j =1 (4.4) 1 l ∧ ∑| ( y j − y j ) | l j =1 ∧ B _ Pr ed = max (y j− yj) S _ Pr ed = max (y j − y j ) ∧ (4.5) ∧ ∀ y j ≤ yj , ∧ ∀ y j ≥ yj j = 1,2,..., l (4.6) j = 1,2,..., l (4.7) Una vez que se ha descrito a la RNA como sistema, es decir, ya que se ha especificado el tipo de RNA, los parámetros a ajustar así como las medidas de desempeño que medirán las respuestas en nuestro experimento, se procede con el siguiente paso de la metodología que incluye la planeación, ejecución e interpretación de un diseño experimental. Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 45 4.2.2. Análisis y Diseño de Experimentos Dadas las especificaciones anteriores, los parámetros o factores controlables que se consideraron en el desarrollo de la metodología fueron: neuronas, lags, escala, transformación y algoritmo, es decir k = 5 . La experimentación fue planeada para variar lags en el rango [2,6], neuronas en el rango [2,7], transformación en {ninguna, diferencias}, escala en {observada, [-1,1]} y algoritmo en {lm,br}. Consideramos 3 niveles para lags y neuronas, mientras que para transformación, escala y algoritmo se consideraron sólo 2 niveles como se pudo observar. Al llevar a cabo el experimento de acuerdo a las especificaciones de la Sección 4.2.1, se consideró adecuado utilizar un diseño factorial de 32x23 que resultó en un total de 72 combinaciones factoriales para correr el modelo de RNAs. Los valores específicos que se consideraron para cada factor en su nivel correspondiente fueron: lags = {2,3,6}, neuronas = {2,5,7}, transformación = {ninguna, diferencias}, escala = {observada, [-1,1]} y algoritmo = {lm , br}. Para manejar los valores de los parámetros en forma numérica se utilizó la codificación siguiente: en el parámetro transformación ‘ninguna’ = 1 y ‘diferencias’ = 2; en escala, ‘observada’ =1 y ‘[-1, 1]’ =2; mientras que para algoritmo, ‘lm’ = 1 y ‘br’ = 2. Los resultados del experimento se muestran en la Tabla 4.1. Como puede observarse, las primeras cinco columnas contienen el valor que tomó cada uno de los factores (parámetros) en la realización de la corrida del modelo de RNAs. Las columnas siguientes contienen el valor que tomaron las medidas de desempeño de la RNA para la combinación de factores dada. Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 46 Tabla 4.1: Resultados del experimento (Primera parte). Neuronas Lags Escala Transformación Algoritmo MAE MSE B_Pred S_Pred 2 2 1 1 1 15.38 717.49 69.89 125.52 2 2 1 2 1 14.83 822.03 73.26 130.74 2 2 2 1 1 14.99 609.14 66.36 105.76 2 2 2 2 1 14.41 808.62 71.63 132.36 2 3 1 1 1 15.39 725.56 70.07 125.99 2 3 1 2 1 15.25 724.62 68.28 135.72 2 3 2 1 1 14.89 613.74 66.36 105.42 2 3 2 2 1 12.53 523.33 69.62 135.46 2 6 1 1 1 15.31 566.63 69.56 116.49 2 6 1 2 1 15.02 578.48 69.35 98.61 2 6 2 1 1 13.43 501.43 69.18 112.18 2 6 2 2 1 10.60 248.54 65.77 41.95 5 2 1 1 1 15.09 698.58 70.89 125.17 5 2 1 2 1 11.80 448.97 65.35 128.56 5 2 2 1 1 12.47 407.59 43.30 114.36 5 2 2 2 1 9.93 440.55 69.97 134.07 5 3 1 1 1 15.01 715.72 69.37 126.64 5 3 1 2 1 14.69 759.51 69.42 142.16 5 3 2 1 1 10.21 355.73 65.85 108.67 5 3 2 2 1 9.78 251.53 70.43 55.35 5 6 1 1 1 15.46 553.00 59.24 101.95 5 6 1 2 1 12.71 545.57 68.51 120.65 5 6 2 1 1 7.04 169.25 30.79 74.33 5 6 2 2 1 3.29 32.99 21.04 13.86 7 2 1 1 1 14.81 700.10 70.41 125.41 7 2 1 2 1 9.09 178.11 65.23 26.45 7 2 2 1 1 8.89 218.43 63.52 57.49 7 2 2 2 1 7.30 147.09 65.69 32.18 7 3 1 1 1 15.28 722.19 69.49 126.43 7 3 1 2 1 11.85 443.52 68.94 114.13 7 3 2 1 1 9.20 310.22 48.55 108.67 7 3 2 2 1 5.49 68.57 17.46 29.64 7 6 1 1 1 14.45 607.09 64.92 121.57 7 6 1 2 1 13.90 461.54 58.44 90.33 7 6 2 1 1 3.59 19.41 13.88 10.82 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 47 Continuación de la Tabla 4.1 Resultados del Experimento (Segunda parte). Neuronas Lags Escala Transformación Algoritmo MAE MSE B_Pred S_Pred 7 6 2 2 1 0.80 1.68 5.04 4.68 2 2 1 1 2 14.71 594.07 62.21 108.03 2 2 1 2 2 17.08 860.04 77.67 126.22 2 2 2 1 2 16.34 752.57 74.73 125.00 2 2 2 2 2 15.58 835.90 73.23 130.77 2 3 1 1 2 14.89 599.43 62.26 107.29 2 3 1 2 2 17.20 869.86 77.72 126.34 2 3 2 1 2 16.44 762.38 74.79 125.03 2 3 2 2 2 15.63 733.86 73.77 135.76 2 6 1 1 2 14.25 487.30 61.59 110.67 2 6 1 2 2 17.52 902.81 77.79 125.84 2 6 2 1 2 15.91 671.52 72.30 112.24 2 6 2 2 2 13.80 453.44 67.84 92.78 5 2 1 1 2 15.08 595.96 58.55 111.78 5 2 1 2 2 16.72 851.16 76.67 126.80 5 2 2 1 2 16.08 744.92 73.82 123.70 5 2 2 2 2 15.58 835.90 73.23 130.77 5 3 1 1 2 13.79 612.04 59.96 118.52 5 3 1 2 2 16.99 860.63 77.22 126.93 5 3 2 1 2 16.15 753.67 73.94 123.64 5 3 2 2 2 15.63 734.32 73.86 135.75 5 6 1 1 2 12.82 489.91 61.46 117.20 5 6 1 2 2 17.41 894.46 77.55 125.49 5 6 2 1 2 15.81 668.94 71.73 113.97 5 6 2 2 2 16.02 768.42 74.90 131.98 7 2 1 1 2 15.05 697.36 69.75 125.30 7 2 1 2 2 16.64 849.40 76.42 126.89 7 2 2 1 2 16.06 743.19 73.85 123.39 7 2 2 2 2 15.58 835.90 73.23 130.77 7 3 1 1 2 15.08 691.16 68.29 126.37 7 3 1 2 2 15.84 809.28 73.67 130.38 7 3 2 1 2 16.11 751.95 73.94 123.30 7 3 2 2 2 15.64 734.34 73.87 135.74 7 6 1 1 2 16.11 654.56 70.27 111.83 7 6 1 2 2 17.32 888.40 77.36 125.23 7 6 2 1 2 16.79 668.00 71.67 114.15 7 6 2 2 2 16.03 769.16 75.02 131.87 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 48 Los resultados detallados de cada uno de los modelos de RNAs resultantes correspondientes a las combinaciones de los parámetros controlables están contenidos en el Apéndice A1, en dicho apéndice, se puede encontrar las aproximaciones puntuales que realizó cada uno de los modelos, así como el valor del pronóstico para el siguiente período. 4.2.3. Metamodelación Una vez realizado el experimento, se procedió a caracterizar los resultados mediante el análisis de varianza con el fin de conocer la contribución que tenía cada uno de los factores en las medidas de desempeño de la RNA. De esta manera se obtuvo un modelo de regresión como el de la Ecuación 3.1 para cada una de las medidas de desempeño especificadas en la Sección 4.2.1. Recordemos que cada xi para i = 1,2,..., k . corresponde a uno de los parámetros que se decidieron variar en el diseño experimental. De esta manera, x1 corresponde al factor neuronas; x2 representa al factor lags; x3 corresponde al factor escala; x4 representa al factor transformación y por último x5 corresponde al factor algoritmo. Los coeficientes resultantes a partir del análisis de varianza para las variables de regresión en cada medida de desempeño se muestran en la Tabla 4.2. En las dos últimas filas de esta Tabla se muestran dos cantidades adicionales que el software presenta además de los resultados del análisis de varianza básico. La cantidad R 2 se interpreta como el porcentaje de variabilidad total en los datos explicada a través del modelo de regresión utilizado en el análisis de varianza. Por tanto, es deseable que esta cantidad sea cercana al 100%. La otra cantidad R 2 ajustada es una variante de la anterior, difiere de ésta puesto que refleja el número de parámetros significativos en el modelo. Es decir, la cantidad R 2 ajustada decrece a medida que se utilizan términos no significativos en el modelo. El estadístico R 2 ajustada es útil en Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 49 experimentos muy complejos en los que intervienen varios factores en el diseño y se quiere evaluar el impacto de aumentar o disminuir el número de términos presentes en el modelo. Tabla 4.2: Resultados del análisis de varianza para cada medida de desempeño. Variable de Regresión MAE MSE B_Pred S_Pred Constante 29.82 1726.89 102.61 219.74 x1 x2 x3 -1.08 -84.40 0.13 4.36 0.55 -4.72 1.58 20.73 -1.92 -178.61 0.88 -23.03 -1.67 -100.62 9.10 -9.47 -14.15 -935.46 -61.57 -145.98 0.02 -0.15 0.07 -1.41 -0.08 -6.00 -0.13 -2.83 0 0 0 0 0 0 0 0 0 0 0 0 0.01 7.41 -0.61 0.61 -0.52 -25.08 -2.99 -4.35 x1 x4 x1 x5 -0.21 -21.05 -1.08 -3.57 1.00 68.57 3.94 9.57 x2 x3 -0.74 -37.02 -3.41 -7.30 x 2 x4 x2 x5 0.06 4.64 -0.61 -2.19 0.52 25.07 4.13 6.03 x3 x4 -1.71 -101.01 -6.87 -7.87 x3 x5 4.84 291.74 19.42 42.71 x4 x5 2.91 237.47 7.45 27.82 88.20% 86.30% 73% 73.00% 84.50% 81.90% 64.70% 64.5% x4 x5 x1 2 x2 2 x3 2 x4 2 x5 2 x1 x2 x1 x3 R R 2 2 ajustada En general, se busca que la diferencia entre estas dos cantidades R 2 y R 2 ajustada sea pequeña, para poder asumir que el modelo de regresión aproxima bien la superficie de Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 50 respuesta. Una diferencia mayor de 20% indica un posible problema entre el modelo y los datos (Montgomery, 2004). Nótese que al aproximar los datos mediante modelos de regresión se parte del supuesto de que los residuos son independientes, siguen una distribución normal y tienen varianza constante. Para asegurar que nuestras conclusiones tengan bases estadísticas sólidas es importante la comprobación de dichos supuestos. La técnica que utilizamos para ello fue el análisis de residuos. Por ejemplo, la Figura 4.3 y la Figura 4.4 nos muestran las gráficas utilizadas en el análisis de residuos para probar los supuestos del modelo de regresión correspondiente a la medida de desempeño de B_Pred. En la Figura 4.3 las gráficas de la izquierda nos permiten comprobar el supuesto de normalidad de los residuos: en la gráfica superior lo que se busca es que los residuos se aproximen lo más posible a una línea recta; el histograma de frecuencias deberá comportarse como una muestra de distribución normal con centro en cero. Las gráficas de la derecha son utilizadas para la comprobación del supuesto de independencia estadística: en éstas se debe visualizar que los valores de los residuos no sigan alguna estructura reconocida. El comportamiento en la gráfica de Residuos vs. Valor ajustado muestra una agrupación de los valores en una región, este comportamiento nos acusó a que el supuesto de independencia podría ser violado. Así que recurrimos a una prueba de correlación de residuos contra valor ajustado para comprobar la independencia y obtuvimos un coeficiente de correlación de 0.001 con un valor P=0.995. Por tanto, concluimos que los residuos cumplieron con el supuesto de independencia estadística. Información detallada acerca de este análisis gráfico de los residuos se puede encontrar en Montgomery (2004). Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período Probabilidad Normal Residuos vs Valor Ajustado 99.9 20 10 90 Residuo Percentil 99 50 10 0 -10 1 0.1 -20 -20 -10 0 Residuo 10 20 20 Histograma de los Residuos 80 Residuos vs Orden de los Datos 10 18 Residuo Frecuencia 40 60 Valor A justado 20 24 12 0 -10 6 0 51 -20 -20 -10 0 Residuo 10 20 0 15 30 45 Orden de Observación 60 Figura 4.3: Gráficas para comprobación de normalidad e independencia estadística de los residuos en el modelo de regresión de la B_Pred. Para comprobar el supuesto de varianza constante, se graficaron los residuos asociados a cada una de las medidas de desempeño contra cada una de las variables o factores, que en nuestro caso fueron: neuronas, lags, escala, transformación y algoritmo. Por ejemplo, la Figura 4.4 contiene las gráficas resultantes para residuos contra variables para el caso de la medida de desempeño B_Pred. Si los residuos tienen desviaciones aproximadamente constantes a lo largo de los diferentes valores (niveles) de cada uno de los factores o variables, se dice que se cumple el supuesto de igualdad de varianza. Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 52 Residuos vs. Neuronas Residuos vs. Lags 20 Residuo Residuo 20 0 0 -20 -20 2 5 2 7 3 6 Lags Neuronas Residuals Versus Escala Residuos vs. Transformación 20 Residuo Residuo 20 0 0 -20 -20 1 1 2 2 Transformación Escala Residuos vs. Algoritmo Residuo 20 0 -20 1 2 Algoritmo Figura 4.4: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza en los residuos del modelo de regresión de la B_Pred. Como puede observarse, tanto en la Figura 4.3 como en la Figura 4.4, el modelo de regresión para B_Pred cumplió suficientemente con los supuestos establecidos. Entonces concluimos que el modelo fue apropiado y proseguimos con la interpretación de los resultados tomando como base este modelo. Algunas veces no será fácil determinar si estos supuestos se cumplen y deberá recurrirse a pruebas estadísticas formales que se pueden encontrar en fuentes como Devore (1995). Los resultados completos acerca del análisis de residuos para cada una de las medidas de desempeño, se encuentran en el Apéndice A2. Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 53 De acuerdo a la metodología propuesta, se consideró aplicar optimización a los modelos encontrados para determinar qué valores debían tomar cada uno de los factores para mejorar el desempeño de la RNA, este paso se describe a continuación. 4.2.4. Problemas de Optimización y Solución Considerando la formulación 3.2 y los resultados mostrados en la Tabla 4.2, se construyeron los problemas de optimización correspondientes a cada medida de desempeño. La modelación de éstos se realizó en Excel, el Apéndice A3 muestra de manera detallada los resultados de la optimización. Una vez que se tuvo la modelación, se procedió a resolver de forma independiente cada uno de los modelos utilizando múltiples soluciones iniciales. La Tabla 4.3 muestra la evaluación de las mejores soluciones a las cuales se tuvo convergencia partiendo de múltiples soluciones iniciales en las diferentes medidas de desempeño. La primera columna de la Tabla 4.3 contiene las mejores soluciones. Cada solución que representa una combinación de los parámetros de la RNA a los cuales les corresponde un determinado valor objetivo en cada medida de desempeño, determinado por el metamodelo encontrado. Así por ejemplo, la solución (2, 2, 1, 1, 2) indica la asignación siguiente: neuronas = 2 ; lags =2; escala = 1 u ‘observada’; transformación = 1 o ‘ninguna’ y algoritmo = 2 o ‘br’; tal asignación dio el siguiente resultado en el valor objetivo de las medidas de desempeño: MAE =13.73; MSE = 578.49; B_Pred = 53.17 y S_Pred = 91.74. Las funciones objetivo son metamodelos que aproximan nuestras medidas de desempeño, por ello es posible que en la optimización alcancen valores negativos, sin embargo al correr el modelo real de RNA las medidas de desempeño toman siempre valores positivos. Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 54 Tabla 4.3: Mejores soluciones encontradas. Solución 2,2,1,1,2 2,6,1,1,2 7,2,1,1,2 7,2,1,2,2 7,6,2,1,1 7,6,2,2,1 MAE 13.73 15.02 15.70 16.79 6.60 3.30 MSE 578.49 497.93 678.89 814.13 136.81 -47.87 B_Pred 53.17 67.48 70.06 78.44 26.61 18.24 S_Pred 91.74 99.36 112.11 121.08 41.65 6.18 Como puede observarse en la Tabla 4.3, la mejor solución encontrada fue (7, 6, 2, 2, 1) , ésta indicó que se debían manejar los datos en diferencias y en escala [-1,1], utilizando como entrada las diferencias de la demanda registrada en los últimos 6 períodos con 7 neuronas en la capa oculta y el algoritmo de entrenamiento lm. La RNA correspondiente a esta solución se comporta como se muestra en la Figura 4.5, las medidas de desempeño en el modelo de RNA adquirieron los siguientes valores: MSE = 0.80, MAE = 1.68, B_Pred = 5.04 y S_Pred = 4.68 .Puede observarse que este modelo hace una muy buena aproximación de los datos reales. Esta fue la mejor solución que encontró el paquete computacional de optimización al minimizar cada una de las medidas de desempeño. La solución obtenida resultó ser la mejor para todas las medidas de desempeño utilizadas, así que pudimos concluir que en este caso particular las medidas de desempeño estaban altamente correlacionadas. Si por el contrario, los objetivos o medidas de desempeño hubiesen llevado a soluciones distintas entre sí, tomar una decisión acerca de cuáles eran los mejores valores de los parámetros de la RNA sería una tarea más complicada. En tal caso sería necesaria la utilización de técnicas de optimización multicriterio. Es necesario comentar que, aunque describimos previamente el fenómeno de sobreentrenamiento, en este caso específico no se consideró explícitamente. El objetivo de este caso fue inicialmente probar la metodología, sin embargo, la técnica de Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 55 validación cruzada se utiliza para evitar el sobreentrenamiento de la RNA en el Capítulo 5. Real RNAs 800 Unidades de Demanda 700 600 500 400 300 200 100 0 1 7 13 19 25 31 37 43 49 55 61 67 Tiempo (meses) Figura 4.5: Modelo de RNAs vs Modelo Real. Una vez que se aplicó la optimización con los modelos de regresión, concluimos que la solución final especificó los valores que debían tomar los parámetros para que la RNA resultante tuviera un desempeño adecuado. Las herramientas computacionales utilizadas para la ejecución del procedimiento propuesto fueron Matlab, Minitab y Excel. El primero fue utilizado para construir los modelos de RNAs, el segundo para el análisis estadístico y el tercero para realizar la optimización a través de su herramienta XL Solver. Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período 56 4.3. Conclusiones En este capítulo se probó la metodología propuesta en el Capítulo 3, para seleccionar los parámetros que intervienen en la construcción y utilización de RNAs. Se pudo demostrar que la metodología trabaja bien por medio de un caso práctico de predicción de demanda en la industria de las telecomunicaciones. La metodología propuesta puede aplicarse a RNAs con arquitecturas más complicadas, tales como las utilizadas para predecir varios períodos de demanda en el futuro. La consecución del trabajo aquí presentado consideró precisamente este caso de predicción multiperíodo en el cual se pronosticaron doce períodos. Este caso se describe en el siguiente capítulo. CAPÍTULO 5 PRONÓSTICO DE SERIES DE TIEMPO DE MÚLTIPLES PERÍODOS Introducción Un problema común en el pronóstico de series de tiempo es la baja exactitud de los pronósticos a largo plazo. El valor estimado de una variable a corto plazo puede realizarse con exactitud aceptable, sin embargo, para estimarlo a largo plazo es comúnmente menos exacto (Hanh et al., 2004). El pronóstico a largo plazo ha sido utilizado en la planeación de expansión de capacidad, inversión de capital, análisis de ingresos y estimación del presupuesto de una empresa, aunque en cada aplicación es evidente la gran incertidumbre causada por el horizonte de tiempo z pronosticar (AlSaba et al., 1999). Para tratar este problema, han sido desarrolladas diferentes técnicas mediante el uso de RNAs. Entre las más utilizadas destacan las técnicas iterativas que utilizan un modelo de RNA multicapa con una sola salida (representado en la Figura 4.2) de manera recursiva para predecir múltiples períodos. Otra técnica es el uso de multiples RNAs 57 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 58 desarrolladas cada una de manera independiente para un horizonte de planeación distinto. Por último, el uso de un modelo de RNA más complejo, en el cual la RNA tiene múltiples salidas dependiendo del número de períodos a predecir. Esta técnica, se espera que conduzca a mejores resultados (Zhang, 2004) que las dos descritas anteriormente, sin embargo, aún no está teóricamente demostrado. En este capítulo se hace uso de una RNA con múltiples salidas para predecir el comportamiento de la demanda de la empresa de telecomunicaciones, teniendo como objetivo pronosticar 12 períodos futuros. Se analizaron dos series de tiempo proporcionadas por la empresa, utilizamos períodos de tiempo mensuales y la construcción del modelo de RNA se realizó mediante la aplicación de la metodología propuesta en el Capítulo 3. En la Sección 5.1 se describe el problema de la empresa de telecomunicaciones, en la Sección 5.2 se explica la construcción de los modelos de RNAs para cada una de las series analizadas y por último, en la Sección 5.3 se presentan las conclusiones. 5.1. Pronóstico de Demanda en telecomunicaciones: múltiples períodos Como se dijo en el Capítulo 1, se dispone de una red de transmisión con capacidad finita y una demanda con comportamiento estocástico. Año con año el comité de planeación de la empresa realiza una reunión antes de concluir el año para analizar el comportamiento de la demanda hasta el momento presente con el propósito de estimar el comportamiento de la misma para el año siguiente. A partir de la estimación realizada deben planear el uso adecuado del capital con el que cuenta la empresa. Para un buen uso del capital, el comité de planeación debe estimar el presupuesto que se necesitará para satisfacer la demanda estimada, así mismo como determinar qué momento es el más apropiado para hacer uso del mismo. Los equipos la empresa maneja son muy costosos y cuando se requiere realizar una expansión de capacidad, el proceso Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 59 de compra e instalación de equipo toma un período de aproximadamente 4 meses. Es necesario entonces tener una visión hacia el futuro que permita prever el crecimiento de la demanda y de esta manera generar la solicitud de compra e instalación de nuevos equipos en la red de transmisión. De lo contrario, se presentará el problema de clientes insatisfechos y no se cumplirá con el objetivo de alto nivel de servicio. En este caso, nuestro objetivo es brindarle al tomador de decisiones un modelo que aproxime el comportamiento de la demanda y que permita pronosticar el comportamiento mensual de ésta con un horizonte de pronóstico a 12 meses. De esta manera, el tomador de decisiones estará en condiciones de realizar al fin del año, una estimación del presupuesto que será necesario para satisfacer la demanda del año venidero, y al analizar la demanda mes con mes, tendrá la capacidad de determinar si es necesaria una expansión y en qué momento debe hacerla. Así se incurrirá en la minimización de costos y maximización de clientes satisfechos. Para nuestro estudio contamos con dos series de tiempo que representan el comportamiento de la demanda registrada a lo largo del tiempo, cada una de éstas corresponde a la demanda de un tipo de servicio de los que brinda la empresa. Tales series de tiempo se presentan en las Figuras 5.1 y 5.2 respectivamente. Unidades de Demanda 800 700 600 500 400 300 200 100 0 1 7 13 19 25 31 37 43 49 55 61 67 Tiempo (meses) Figura 5.1: Comportamiento de la demanda, Serie 1. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 60 Pudo observarse que la demanda se comporta de manera diferente dependiendo del tipo de servicio del que se trate. La práctica común de aproximar las series de tiempo por medio de una tendencia lineal es claramente inadecuada en estos casos, en el Capítulo 6 se presenta mayor evidencia acerca de esto. 250 Unidades de Demanda 200 150 100 50 0 1 7 13 19 25 31 37 43 49 55 61 67 Tiempo (meses) Figura 5.2: Comportamiento de la demanda, Serie 2. Fue claro que las decisiones estratégicas y tácticas de la empresa se basan en la realización de pronósticos y por tanto requerimos construir un buen modelo que les permita obtener pronósticos confiables. Con esto en mente, se construyó un modelo para cada una de las series aquí mostradas basado en RNAs. La arquitectura de la RNA utilizada es similar a de la Figura 5.3, en la cual se obtiene como salida el valor del pronóstico para los siguientes doce meses. Las especificaciones del modelo y la selección de parámetros se presentan de manera detallada a continuación. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 61 5.2. Construcción de un Modelo de RNA para Pronóstico de Series de Tiempo de múltiples períodos Teniendo como principal objetivo construir un modelo de RNA con características que permitan encontrar pronósticos acertados para un horizonte de planeación de doce meses, aplicamos la metodología descrita en el Capítulo 3 considerando las series de tiempo mostradas en la Figura 5.1 y Figura 5.2. 5.2.1. Descripción de la RNA como Sistema Determinación del tipo de RNA que se utilizó para el análisis. Para el análisis de las series utilizamos un modelo de RNA como el representado en la Figura 5.3. Es una RNA de tres capas hacia delante entrenada por retropropagación del error. Puesto que en esta aplicación nuestro objetivo era pronosticar el comportamiento de la demanda para los siguientes doce períodos, cada patrón de entrenamiento o validación tenía asociado un vector de doce valores (target) formado por la demanda registrada en los doce meses siguientes a partir del último registro considerado en el patrón de entrada. Cabe señalar que la cantidad de valores en el patrón de entrada determina la cantidad de neuronas en la capa de entrada. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos W Y ji V t 62 sj Y Y t + 1 t − 1 Y . . . . . . t + 2 . . . Yt −m +1 Yn Yt − m b Capa de Entrada b s j Capa Oculta Capa de Salida Figura 5.3: Red neuronal artificial de propagación hacia adelante, entrenada por retropropagación del error de pronóstico con tres capas y múltiples salidas. En esta RNA se tienen n neuronas en la capa de salida cada una de las cuales calcula el valor del pronóstico para cada período futuro. Si actualmente estuviéramos en el período t , las neuronas de salida nos darían el pronóstico para los períodos t + 1 hasta el período t + n , donde en nuestro caso n = 12 . La representación matemática de la RNA es la descrita en la Ecuación (4.1), sólo que en este caso la salida fue un vector con 12 componentes. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 63 Los resultados obtenidos en el capítulo anterior para una RNA con una salida que pronostica un solo período mostraron que es importante el preprocesamiento de la información con la cual se alimenta a la RNA y además, el algoritmo de entrenamiento lm resultó con un mejor desempeño en el modelo. En este caso, incorporamos tales consideraciones para llevar a cabo la construcción del modelo de RNA para múltiples períodos. Es decir, utilizamos la información normalizada en la escala [-1, 1] y para llevar a cabo el entrenamiento de la RNA utilizamos el algoritmo de LevenbergMarquard (lm). Identificación de los parámetros controlables. El número de neuronas en la capa oculta debe ser ajustado y por tanto fue incluido como parámetro controlable de manera similar que en el caso anterior, nuevamente lo denominamos como neuronas. Otro parámetro más que se incluyó en el desarrollo del modelo, fue la cantidad de datos históricos o lags que se utilizarían como entradas de la RNA para el cálculo de los pronósticos. Como ya se mencionó, éste es muy importante puesto nos indica hasta qué período en el pasado se correlacionan los datos. Definición de las respuestas de interés (medidas de desempeño de la RNA). Para medir la calidad de aproximación de la RNA es común el uso de validación cruzada. Como se describió en el Capítulo 2, la manera de seleccionar los subconjuntos de entrenamiento y validación no está estandarizada. En varios trabajos se seleccionan éstos ya sea de manera conveniente o bien no se menciona cómo lo hacen. Especialmente en pronósticos, es posible realizar la selección de forma tal que se sesgue el desempeño de cada método o modelo. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 64 El conjunto de entrenamiento estuvo formado por aproximadamente el 70% de los patrones disponibles y el de validación se definió utilizando aproximadamente el 30% de éstos. Los elementos del conjunto de validación fueron seleccionados mediante una distribución uniforme sin reemplazo con el propósito de otorgar el mayor conocimiento a la RNA y evitar el sesgar la información disponible. Utilizamos esta proporción en los subconjuntos, pues ha sido sugerida en la literatura (Zhang et al., 1998; Granger 1993). El desempeño de la RNA fue cuantificado mediante el Error Cuadrado Medio o MSE, considerando a éste tanto para la fase de entrenamiento (MSE_T) como para la fase de validación (MSE_V) del modelo. Generalmente, la inicialización de los pesos de las conexiones de la RNA se realiza de manera aleatoria, en nuestra aplicación, utilizamos diferentes puntos de inicio para los pesos de las conexiones. Consideramos inicios múltiples ya que al hacer la actualización de pesos mediante la retropropagación del error realmente se está minimizando una función de error, que es no lineal y no convexa, por tal razón, el punto de inicio de la optimización es determinante para los pesos finales que adquieren las conexiones una vez que el entrenamiento termina. Los diferentes puntos de inicio de los pesos de las conexiones entre las neuronas y umbrales con neuronas fueron: • Inicialización de los pesos en 0. • Inicialización aleatoria en el intervalo [-1, 1]. • Inicialización de pesos en -0.5. • Inicialización de pesos en 0.5. • Inicialización de pesos en -1. • Inicialización de pesos en 1. Esta manera de inicialización del modelo de RNA permite tener un mejor control del comportamiento del modelo, es decir, permite la reproducción de los resultados puesto que se sabe con certeza los puntos de inicio del modelo bajo los cuales la RNA obtiene cierto valor en la medida de desempeño. Si sólo se utilizara la inicialización aleatoria, Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 65 sería difícil la reproducción de los resultados pues se desconocerían las condiciones iniciales bajo las cuales se construyó el modelo. Las especificaciones aquí descritas, fueron las mismas para la modelación de las dos series mostradas anteriormente, sin embargo, el Análisis y Diseño de Experimentos fue distinto dependiendo de la serie. A continuación se describe esta etapa de la metodología, aplicada a cada una de las series. 5.2.2 Análisis y Diseño de Experimentos para la Serie 1 Dadas las especificaciones anteriores, los parámetros o factores controlables que se consideran en el desarrollo de la metodología fueron: lags y neuronas, es decir k = 2 . La experimentación fue planeada para variar lags en el rango [3,15] y neuronas en el rango [2,10]. Consideramos 5 niveles de cada uno de éstos parámetros. Los valores específicos que se consideraron para cada factor en su nivel correspondiente fueron: lags = {3, 6, 9, 12, 15} y neuronas = {2, 4, 6, 8, 10}. En el experimento se utilizó un diseño factorial que resultó en un total de 25 combinaciones factoriales para correr el modelo de RNAs. Cada combinación factorial determina el valor al cual deben fijarse los parámetros controlables del modelo. Para cada una de éstas construimos un modelo de RNA utilizando las múltiples inicializaciones y finalmente seleccionamos como resultado de la combinación de factores aquélla RNA con menor MSE_V. Es decir, para cada combinación de factores creamos seis RNAs diferentes, cuantificamos el valor de las medidas de desempeño utilizadas en cada una de las seis RNAs y al final seleccionamos la RNA con el MSE_V más pequeño. Por supuesto que se registró el valor con el cual fue inicializada la mejor RNA para facilitar la reproducción de los resultados. Los resultados del experimento se muestran en la Tabla 5.1. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 66 Tabla 5.1: Resultados del experimento de la Serie 1. Lags Neuronas MSE_T MSE_V Inicio 3 2 2104.8 1767 0 3 4 340.7 653.2 -1 3 6 268.6 734.1 Aleatorio 3 8 169.7 1757.3 0.5 3 10 2066.8 1739.8 0 6 2 625.8 1221.9 Aleatorio 6 4 243.1 612.9 0 6 6 154.2 611.4 Aleatorio 6 8 102.8 3454.3 Aleatorio 6 10 9 2 775.4 1665.2 Aleatorio 9 4 252.9 1401 Aleatorio 9 6 151.8 1252.4 -0.5 9 8 9 10 44.4 6668.9 0.5 12 2 403.8 1203.4 Aleatorio 12 4 218.3 5754.3 Aleatorio 12 6 15357.7 14775 0 12 8 15357.7 14775 0 12 10 15357.7 14775 0 15 2 574.5 1828.6 -1 15 4 10864.5 13646.8 0 15 6 10864.5 13646.8 0 15 8 10864.5 13646.8 0 15 10 10864.5 13646.8 0 21338.1 25253.7 20364.7 15741.9 0 0 Como puede observarse en la Tabla 5.1 las primeras dos columnas contienen el valor que tomó cada uno de los factores (parámetros) para realizar la corrida del modelo de RNAs. La tercer y cuarta columna contiene el valor que alcanzaron las medidas de desempeño de la RNA en el entrenamiento y validación respectivamente, mientras que en la última columna se muestra el valor al cual fueron inicializados los pesos de las conexiones de la RNA. Los resultados detallados de cada uno de los modelos de RNAs resultantes correspondientes a las combinaciones de los parámetros controlables están contenidos en el Apéndice B1, donde se muestra el pronóstico que se obtuvo con cada uno de los modelos de RNAs experimentales. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 67 5.2.2.1. Metamodelación Una vez realizado el experimento, se procedió a caracterizar los resultados mediante el análisis de varianza con el fin de conocer la contribución de cada uno de los factores en las medidas de desempeño de la RNA. El modelo de regresión propuesto fue el descrito en la Ecuación 3.1. De esta manera, se obtuvo un modelo de regresión para cada una de las medidas de desempeño especificadas en el paso anterior. Siguiendo la notación del Capítulo anterior, x1 corresponde al factor lags y x2 representa al factor neuronas. La Tabla 5.2 contiene los coeficientes del modelo de regresión resultantes para las medidas de desempeño, contiene también los valores P asociados a cada término de regresión y los valores del coeficiente de determinación ajustado y no ajustado. El valor P es utilizado para determinar si un término de regresión (fuente de variación) afecta significativamente a la medida de desempeño, mediante una prueba de hipótesis. Considerando como hipótesis nula que la fuente de variación no afecta significativamente la medida de desempeño, el valor P indica el nivel de significancia mínimo para el cual la hipótesis nula es rechazada. Es decir, P puede considerarse como el menor nivel α en el que la fuente de variación es significativa. Por tanto, para concluir si una fuente de variación es significativa, basta con saber si el valor P es menor que α , dado que se hayan cumplido los supuestos de los residuos. En la Tabla 5.2 la tercera columna contiene los valores P asociados a las fuentes de variación en el modelo correspondiente al MSE_T y la quinta contiene los P correspondientes al MSE_V. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 68 Tabla 5.2: Resultados del análisis de varianza en las medidas de desempeño, Serie 1. Variable de Regresión MSE_T P MSE_V P Constante -5828.99 0.568 -6087.75 0.490 x1 x2 1917.23 0.700 2316.88 0.590 1491.84 0.764 1289.84 0.764 -205.31 0.785 -139.45 0.830 -58.01 0.938 86.54 0.894 454.17 0.473 304.32 0.576 x1 2 2 x2 x1 x2 R R 2 42.80% 55.10% 27.70% 43.30% 2 ajustada Como se observa en la Tabla 5.2, para el MSE de entrenamiento sólo un 27.7% de la variación total es explicada con el modelo de regresión y para el MSE de validación sólo un 43.3% de su variación se explica con el modelo utilizado. Es decir, los coeficientes de determinación para ambas medidas de desempeño son muy bajos. Además los valores de P asociados a los coeficientes de ambos modelos no acusan algún efecto importante. Lo anterior nos llevaría a concluir que si tratamos de explicar la variabilidad que produce cada factor en la medida de desempeño, tomando como base el modelo de regresión encontrado, no se tendrían bases estadísticas fuertes que apoyaran nuestras conclusiones. Para tener una visión más clara acerca de los resultados obtenidos en el experimento, realizamos un análisis de la superficie de cada respuesta o medida de desempeño mediante gráficas de contorno y de superficie. En la Figura 5.4 se muestran las gráficas resultantes. En base al comportamiento que mostraron las medidas de desempeño en la Figura 5.4, fue posible identificar que tanto para el MSE de entrenamiento como para el MSE de validación existía una región de los factores lags y neuronas que proporcionaba un buen desempeño al modelo de RNAs. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 69 Empíricamente fue posible ubicar tanto en las gráficas de contorno como en las de superficie una región en la cual las medidas de desempeño eran pequeñas. Esta región está delimitada por los 3 primeros niveles de cada factor (lags y neuronas) como se puede apreciar en la Figura 5.4. Guiándonos por los resultados gráficos, se observó claramente que al utilizar más de 12 datos históricos y más de 6 neuronas en la capa oculta el desempeño del modelo de RNAs no sólo empeoró sino que se volvió altamente no lineal impidiendo así una regresión adecuada. MSE_T 15.0 MSE_V 15.0 8000 10000 16000 12.5 12.5 15000 16000 10.0 20000 7.5 Lags Lags 10.0 8000 15000 7.5 12000 4000 5000 5.0 15000 5.0 2 4 6 8 10 2 4 6 Neuronas 8 10 Neuronas 20000 20000 MSE_T 10000 MSE_V 10000 0 15 15 0 10 10 3 6 Neuronas 9 5 Lags 3 6 Neuronas Lags 5 9 Figura 5.4: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V experimental en la Serie 1. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 70 Al considerar el análisis anterior decidimos enfocar (reducir) el área experimental con el fin de encontrar metamodelos confiables. Se consideraron únicamente aquéllos modelos de RNAs con parámetros dentro del rango identificado gráficamente con buen desempeño, es decir, modelos en los cuales los parámetros lags y neuronas estaban dentro de sus tres primeros niveles. Se tomaron entonces las corridas experimentales resultantes de la combinación de lags = {3, 6, 9} y neuronas = {2, 4, 6}. Una vez que enfocó el experimento, se realizó nuevamente el análisis de varianza para estos resultados, logrando así coeficientes de determinación mayores a los obtenidos inicialmente como se puede observar en la Tabla 5.3 La interpretación de esta tabla es similar a la de la Tabla 5.2. Tabla 5.3: Resultados del análisis de varianza en las medidas de desempeño, Serie 1 (Experimento enfocado). Variable de Regresión MSE_T Constante x1 x2 x1 2 2 x2 x1 x2 R R P MSE_V P 5611.64 0.032 4518.51 0.009 -698.07 0.151 -612.13 0.046 -1349.81 0.090 -965.59 0.040 34.23 0.314 47.79 0.045 100.29 0.214 79.90 0.091 50.53 0.192 25.83 0.190 2 87.40% 94.00% 66.30% 84.10% 2 ajustada En la Tabla 5.3 se observa que los coeficientes de determinación para ambas medidas de desempeño son mayores del 80%, por tanto, podemos decir que los modelos de regresión son apropiados para describir buena parte de la variabilidad de las medidas de desempeño utilizadas. Cabe señalar, que en este caso, existe mayor diferencia entre R 2 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos y R 2 ajustada debido a que R 2 ajustada 71 penaliza la incorporación de términos no significativos en el modelo. Con estos nuevos resultados del análisis de varianza, cabe hacer notar los resultados benéficos de enfocar el experimento, esto es, de reducir el área experimental. Enfocar el experimento será de gran utilidad cuando se presenten resultados como los que encontramos durante el análisis de este caso. En la Figura 5.5 se muestra gráficamente las gráficas de contorno y superficie descritas por las medidas de desempeño en el área experimental reducida. Observamos que las gráficas de superficie están definidas por curvas más suaves que en la Figura 5.4 haciendo más sencilla la aproximación de las mismas mediante los modelos de regresión. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 72 MSE_T MSE_V 9.0 9.0 1200 1000 7.5 6.0 Lags Lags 7.5 500 4.5 3.0 6.0 800 4.5 2 3 4 5 6 3.0 2 3 4 Neuronas Neuronas 5 6 2000 1500 1500 MSE_V MSE_T 1000 1000 500 500 2 2 4 Neuronas Neuronas 4 8 6 6 4 6 Lags 4 8 6 Lags Figura 5.5: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V en el experimento enfocado. Ahora bien, comparando los modelos de aproximación (metamodelos) antes y después de enfocar el experimento, la Figura 5.6 muestra claramente el cambio producido por la reducción del área experimental. Los modelos de regresión para las medidas de desempeño pasaron de ser superficies no convexas a superficies convexas. Estos resultados son muy convenientes en términos de optimización. Con este comportamiento corroborado gráficamente y el hecho de que los metamodelos son Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 73 regresiones de segundo orden, es posible asegurar empíricamente la existencia de un óptimo global en el área experimental de cada una de las medidas de desempeño. MSE_V (Enfocado) MSE_V 4000 25000 3000 2000 20000 1000 15000 0 -1000 10000 -2000 C13 Lags C5 9 C1 9 5 7 C1 5 -5000 7 Lags 3 1 C5 C9 1 0 C13 -3000 -4000 C9 3 5000 Neuronas Neuronas MSE_T (Enfocado) MSE_T 2000 25000 1000 20000 0 -1000 15000 -2000 10000 -3000 C13 5000 C9 C5 Neuronas C1 9 7 3 5 1 0 Lags -4000 C13 -5000 C9 C5 -6000 1 2 3 4 5 6 7 8 9 10 Neuronas Lags C1 Figura 5.6: Superficie de los metamodelos para el MSE_T y MSE_V antes y después del enfoque del Experimento. El enfoque del experimento nos permitió mejorar la calidad de la aproximación de los metamodelos obtenidos mediante el análisis de varianza en áreas experimentales de interés. Esta mejora nos sirvió para sustentar nuestras conclusiones acerca de la variación producida por los parámetros en las medidas de desempeño y nos brindó la certeza de que la optimización tendrá como base un metamodelo confiable con fundamento estadístico. Regresando a la Figura 5.4 y suponiendo que colocamos las gráficas de contorno una encima de la otra, la intersección de éstas nos da las combinaciones de parámetros que Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 74 mejoran simultáneamente ambas medidas de desempeño. Basados en estas gráficas se puede decir que el modelo de RNA con mejor desempeño de acuerdo a las medidas utilizadas, sería aquél en el cual el factor neuronas estuviera dentro del rango [4,6] y el factor lags en el rango de variación de [3, 6]. Sin embargo, para determinar los valores puntuales que debían tomar los parámetros de la RNA fue necesario recurrir a la optimización. Por supuesto, tampoco se pasó por alto la comprobación de los supuestos bajo los cuales fueron construidos los metamodelos. La comprobación se realizó de la misma forma como se presentó en el Capítulo 4, es decir, mediante el análisis gráfico de los residuos. Las gráficas utilizadas en el análisis de residuos para este caso están disponibles en el Apéndice B2. 5.2.2.2. Problemas de Optimización y Solución, Serie 1 Comprobados los supuestos, construimos los problemas de optimización como se muestra en la formulación (3.2) a partir de los metamodelos y realizamos la optimización. Se utilizaron nuevamente múltiples soluciones iniciales para probar si efectivamente se convergía a una misma solución, pues tal comportamiento apoya la hipótesis de convexidad, establecida empíricamente en el paso anterior. Las Tablas 5.4a y 5.4b muestran las soluciones a las cuales convergieron cada uno de los modelos de optimización. La primera componente de la solución corresponde al valor que tomó el parámetro lags y la segunda componente corresponde al valor del parámetro neuronas. La segunda y tercera columna muestra el valor de la función objetivo para el MSE_T y el MSE_V respectivamente. Recuérdese que las funciones objetivo son metamodelos que aproximan la superficie de respuesta de la RNA, por tanto es posible que en la optimización alcancen valores negativos, sin embargo en el modelo real de RNA las medidas de desempeño toman siempre valores positivos. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 75 Tabla 5.4a: Soluciones finales al minimizar el MSE_T, Serie 1. Solución Inicial Solución Final MSE_T MSE_V (3,2) (7,5) -71.07 648.91 (6,4) (7,5) -71.07 648.91 (9,6) (7,5) -71.07 648.91 (4,3) (7,5) -71.07 648.91 (5,3) (7,5) -71.07 648.91 (7,5) (7,5) -71.07 648.91 (8,5) (7,5) -71.07 648.91 La Tabla 5.4a contiene los resultados obtenidos al resolver el problema de minimización del MSE_T , mientras que la Tabla 5.4b los resultados obtenidos al minimizar el MSE_V. Tabla 5.4b: Soluciones finales al minimizar el MSE_V, Serie 1. Solución Inicial Solución Final MSE_T MSE_V (3,2) (5,5) -1.75 467.91 (6,4) (5,5) -1.75 467.91 (9,6) (5,5) -1.75 467.91 (4,3) (5,5) -1.75 467.91 (5,3) (5,5) -1.75 467.91 (7,5) (5,5) -1.75 467.91 (8,5) (5,5) -1.75 467.91 Observamos que al resolver de manera independiente cada uno de los problemas de optimización partiendo de múltiples soluciones iniciales en ambos casos (Tabla 5.4a y Tabla 5.4b) las diferentes soluciones convergían a una misma solución final. Con esto se comprobaron las hipótesis de convexidad en los modelos y la existencia de optimalidad global en cada una de las medidas de desempeño. Sin embargo, la solución óptima para el MSE_T fue distinta a la que se obtuvo al minimizar el MSE_V. Para el primero, la Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 76 optimización nos llevó a un modelo de RNA con 7 datos históricos (lags) y 5 neuronas en la capa oculta; para el segundo, el modelo de RNA con mejor desempeño fue aquél en el que se consideraron 5 datos históricos y 5 neuronas en la capa oculta. Los resultados obtenidos indican objetivos en conflicto. Dada la importancia de obtener modelos de RNA con buena calidad de aproximación y generalización, decidimos darle mayor importancia al MSE_V. Así que la solución final fue la (5,5). Ya que se tuvo la solución final, es decir los valores a los cuales debían ser ajustados los parámetros, se construyó el modelo de RNA correspondiente para la realización del pronóstico. Consideramos las seis diferentes inicializaciones de pesos en las conexiones y seleccionamos la RNA con menor valor de MSE_V. En la Figura 5.7 se muestra el pronóstico que se obtuvo con éste modelo de RNA, las medidas de desempeño tomaron los valores siguientes: MSE_T = 211.5056 y MSE_V = 1431.77. Los pesos se inicializaron en 0.5. Real RNA Unidades de Demanda 800 700 600 500 400 300 200 100 0 1 7 13 19 25 31 37 43 49 55 61 67 73 79 Tiempo (meses) Figura 5.7: Pronóstico del modelo de RNA definitivo, Serie 1. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 77 En la Figura 5.7 los primeros cuatro períodos del pronóstico pudieron ser comparados contra datos de validación, esta comparación está contenida dentro del rectángulo en la figura y los siguientes ocho períodos pronosticados indican la tendencia de la demanda de acuerdo al modelo de RNA. 5.2.3. Análisis y Diseño de Experimentos para la Serie 2 Los parámetros o factores controlables que se consideraron en este caso fueron los mismos que en la serie anterior: neuronas y lags, es decir k = 2 . La experimentación fue planeada para variar lags en el rango [3,6] y neuronas en el rango [2,6]. Consideramos 3 niveles de cada uno de estos factores. Los valores específicos que se consideraron para cada factor en su nivel correspondiente fueron: lags = {3, 4, 6} y neuronas = {2, 4, 6}. Al llevar a cabo el experimento se consideró adecuado utilizar un diseño factorial de 32 con un total de 9 combinaciones factoriales para correr el modelo de RNAs. Nuevamente, para cada combinación experimental de los niveles de los parámetros construimos modelos de RNAs utilizando las seis inicializaciones descritas anteriormente. De estas seis inicializaciones diferentes se seleccionó la RNA con mejor valor en la medida de desempeño MSE_V y ésta fue la que se registró como resultado de la combinación de los parámetros, así como el valor en el que fueron inicializados los pesos de las conexiones de la misma. Los resultados del experimento se muestran en la Tabla 5.5. En la Tabla 5.5 las primeras dos columnas contienen el valor que tomó cada uno de los factores (parámetros) para realizar la corrida del modelo de RNAs. La tercer y cuarta columna contiene el valor que alcanzaron las medidas de desempeño de la RNA en el Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 78 entrenamiento y validación respectivamente, mientras que en la última columna se tiene el valor en el cual fueron inicializados los pesos de las conexiones de la RNA. Tabla 5.5: Resultados del experimento, Serie 2. Lags Neuronas MSE_T MSE_V Inicio 3 2 82.57 339.73 - 0.5 3 4 61.02 304.30 -1 3 6 2016.10 1674.58 0 4 2 1769.86 2245.94 0 4 4 64.60 650.88 Aleatorio 4 6 1769.86 2245.94 0 6 2 105.31 259.71 Aleatorio 6 4 2003.33 1548.41 0 6 6 2003.33 1548.41 0 Los resultados detallados de cada uno de los modelos de RNAs resultantes correspondientes a las combinaciones de los parámetros controlables están contenidos en el Apéndice B3 el cual muestra el pronóstico que se obtuvo con cada uno de los modelos de RNAs experimentales. Siguiendo la metodología del Capítulo 3, realizamos la fase de metamodelación que se describe a continuación. 5.2.3.1. Metamodelación Una vez realizado el experimento, se procedió a caracterizar los resultados mediante el análisis de varianza con el fin de conocer la contribución que tenía cada uno de los factores en las medidas de desempeño de la RNA. El modelo de regresión propuesto fue el descrito en la Ecuación (3.1). Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 79 En la Tabla 5.6 se presentan los resultados que se obtuvieron del análisis de varianza de los metamodelos correspondientes a las medidas de desempeño MSE_T y MSE_V. Tabla 5.6: Resultados del análisis de varianza en las medidas de desempeño, Serie 2. Variable de Regresión MSE_T P MSE_V P Constante -1107.73 0.909 -5703.14 0.471 x1 x2 1282.29 0.754 3753.74 0.289 -979.62 0.619 -969.18 0.534 -132.31 0.763 -413.03 0.278 145.38 0.513 137.80 0.435 31.36 0.874 19.72 0.898 x1 2 2 x2 x1 x2 R R 2 50.90% 58.10% 0.00% 0.00% 2 ajustada Como se observa en la Tabla 5.6, para el MSE de entrenamiento sólo un 50.9% de la variación total es explicada con el modelo de regresión utilizado y para el MSE de validación sólo un 58.1% de su variación se explica con el modelo. Es decir, los coeficientes de determinación para ambas medidas de desempeño son muy bajos y los valores de P asociados a los coeficientes del modelo no muestran significancia estadística Lo anterior nos llevó a concluir que si tratáramos de explicar la variabilidad producida por cada factor en la medida de desempeño tomando como base estos modelos de regresión, no se tendrían bases estadísticas fuertes que apoyaran nuestras conclusiones. Así que de manera similar a la serie anterior, analizamos la superficie experimental de las medidas de desempeño a través de gráficas de contorno y de superficie, estas gráficas se muestran en la Figura 5.8. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 80 MSE_T MSE_V 6 6 1500 1250 1000 5 Lags Lags 5 750 4 4 500 1000 1500 500 3 2 3 4 5 6 3 2 3 4 Neuronas 5 6 Neuronas 2000 2000 MSE_V MSE_T 1000 1000 6 0 0 2 5 4 2 4 Neuronas 6 3 Lags Neuronas 4 6 3 4 5 6 Lags Figura 5.8: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V experimental en la Serie 2. Empíricamente, fue posible ubicar una región en la cual las medidas de desempeño resultaban pequeñas. De acuerdo a la Figura 5.8, para encontrar un MSE_T con valor bajo el parámetro lags debía estar en el rango [3, 4] y el parámetro neuronas en el rango [2, 4]. Sin embargo, para el MSE_V no fue tan fácil identificar el área con mejor desempeño. Lo que observamos fue que cuando neuronas estaba en su nivel máximo la medida de desempeño MSE_V alcanzaba valores muy altos para cualquier valor del parámetro lags. Más aún, en las gráficas de superficie se observó que la curva descrita por ambas medidas de desempeño era altamente no lineal en el área experimental y tratar de aproximarla con una función cuadrática nos llevaría a tener poca confiabilidad en la caracterización de los resultados. Por tal motivo, se identificó un área atractiva para las medidas de desempeño que pudiera ser aproximada de manera adecuada mediante una función cuadrática. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 81 De acuerdo con los resultados gráficos y el análisis de varianza, se observó claramente que al utilizar 6 neuronas en la capa oculta los modelos de RNAs resultantes tenían capacidad de aproximación y predicción baja. Se redujo el área experimental como en el análisis de la serie anterior y esta vez se realizó un nuevo experimento en el cual consideramos sólo aquéllas combinaciones resultantes de lags = {3, 4, 5, 6} y neuronas = {3, 4}. Resultó un total de 8 combinaciones factoriales, los resultados correspondientes están contenidos en la Tabla 5.7. Tabla 5.7: Resultados del experimento enfocado, Serie 2. Lags Neuronas MSE_T MSE_V 3 3 94.41 245.40 Inicio 0.5 3 4 81.95 258.45 Aleatorio 4 3 87.02 249.19 -0.5 4 4 66.68 279.45 -1 5 3 106.29 131.62 -0.5 5 4 68.58 265.08 Aleatorio 6 3 91.31 255.49 [-1, 1] 6 4 66.83 536.79 1 Para resultados detallados acerca de los pronósticos que se obtuvieron con cada modelo de RNA se sugiere ver el Apéndice B4 en el que se muestra el pronóstico que se obtuvo con cada uno de los modelos de RNAs experimentales. Una vez realizado el experimento en el área reducida, se procedió a caracterizar los resultados mediante el análisis de varianza. Se partió del modelo de regresión descrito en la Ecuación (3.1). La Tabla 5.8 contiene los resultados del análisis de varianza. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 82 Tabla 5.8: Resultados del análisis de varianza en las medidas de desempeño, Serie 2 (Experimento enfocado) Variable de Regresión MSE_T P MSE_V P Constante 103.467 0.437 2022.52 0.095 x1 x2 10.355 0.795 -698.25 0.078 0.296 0.992 -294.06 0.237 0.741 0.837 46.35 0.150 -5.343 0.433 90.80 0.125 x1 2 2 x2 x1 x2 R R 2 82.40% 84.80% 59.00% 64.50% 2 ajustada En la Tabla 5.8 los coeficientes de determinación son mayores del 80%, es decir que los modelos de regresión fueron apropiados para describir buena parte de la variabilidad existente en las medidas de desempeño registradas. Las gráficas del análisis de las superficies de respuesta se muestran en la Figura 5.9. En estas gráficas se observó que el MSE_T disminuyó conforme se incrementaba la cantidad de neuronas en la capa oculta, mientras que el modelo de RNA perdía poder de generalización pues el MSE_V iba en incremento. Lo que destaca el punto anterior es de esperarse en el comportamiento de RNAs, pues conforme la RNA se especializa en determinado patrón, el error de entrenamiento disminuye considerablemente, mientras que el error de validación incrementa debido a que es más difícil para la RNA descubrir nuevas relaciones en los patrones que jamás le fueron mostrados durante el entrenamiento. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos MSE_T MSE_V 6 6 83 400 300 200 5 Lags Lags 5 4 3 80.0 4 70.0 3 4 3 3 4 Neuronas Neuronas 500 100 400 MSE_T 90 MSE_V 300 80 200 6 6 70 5 5 4 3 Lags 4 3 3 3 Neuronas 4 Lags Neuronas 4 Figura 5.9: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V en la Serie 2 (experimento enfocado). Con la Figura 5.9 se observó gráficamente que para ambas medidas de desempeño era favorable utilizar aproximadamente 5 lags y se detectó la relación costo-beneficio existente en las medidas de desempeño. Los metamodelos obtenidos con la redefinición del área experimental fueron mucho más confiables. Después se verificaron los supuestos de los modelos de regresión mediante el análisis de residuos. Los resultados pueden consultarse en el Apéndice B5. Una vez comprobados los supuestos, se prosiguió con la metodología, realizando la optimización de las medidas de desempeño. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 84 5.2.3.2. Problemas de Optimización y Solución, Serie 2 Con la optimización, como ya se explicó anteriormente, se determina a qué valores deben fijarse los parámetros experimentales con el fin de obtener un modelo de RNA confiable. Puesto que el factorial resultante de la redefinición del área experimental abarcó todas las combinaciones posibles en la nueva área y dado que sólo se consideraron dos medidas de desempeño, la solución a estos problemas la realizamos de manera gráfica. En la Figura 5.10, se muestra el comportamiento de las medidas de desempeño registradas, el eje de las ‘x’ corresponde al MSE_V y el eje ‘y’ al MSE_T. 110 MSE_T 100 90 80 70 100 200 300 MSE_V 400 500 Figura 5.10: Gráfica del MSE_T vs MSE_V en la Serie 2. Con los resultados mostrados en la Figura 5.10, lo que buscamos en un principio fue minimizar el MSE_T y encontramos que la combinación de lags y neuronas que daba el valor mínimo en ésta medida de desempeño era la combinación (4,4). Lo cual indicaba que se debían utilizar 4 datos históricos o lags y 4 neuronas en la capa oculta. Sin embargo, cuando resolvimos para minimizar el MSE_V encontramos que la mejor solución era utilizar 5 lags y 3 neuronas en la capa oculta. Fue entonces cuando notamos Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 85 que existía conflicto en las medidas de desempeño, pues éstas convergieron a soluciones diferentes. Al existir conflicto en las medidas de desempeño, en la Figura 5.10 ubicamos la frontera eficiente que representara el mejor compromiso en nuestras medidas de desempeño. Esta frontera eficiente está determinada por la línea que aparece en la gráfica. En esa frontera eficiente encontramos tres de nuestras combinaciones que presentaron el mejor compromiso en nuestras medidas de desempeño, en la Tabla 5.9 se presentan estas soluciones con sus valores correspondientes en las medidas de desempeño utilizadas. Tabla 5.9: Soluciones eficientes para el análisis de la Serie 2. Lags Neuronas MSE_T MSE_V 4 4 66.68 279.45 5 3 106.29 131.62 5 4 68.58 265.08 Observando los valores que tomaron las medidas de desempeño en cada una de las soluciones mostradas en la Tabla 5.9, decidimos darle más importancia a la medida de desempeño MSE_V. Así que en nuestro caso fue claro que la solución más atractiva era aquélla en la que se utilizaban 5 lags y 3 neuronas en la capa oculta del modelo de RNA. Por tanto, elegimos como solución final a esta última pues nos garantiza la obtención de un modelo de RNA confiable con buena calidad de aproximación y poder de generalización. Ya que obtuvimos la solución final, se conoció el valor al cual debían ser ajustados los parámetros y entonces se procedió con la construcción de la RNA correspondiente a esta solución final para realizar el pronóstico. En la Figura 5.11 se muestra el pronóstico que obtuvo el modelo de RNA definitivo cuyos parámetros fueron fijados de acuerdo al resultado de la optimización. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos Real 86 RNA Unidades de Demanda 250 200 150 100 50 0 1 7 13 19 25 31 37 43 49 55 61 67 73 79 Tiempo (meses) Figura 5.11: Pronóstico del modelo de RNA definitivo para la Serie 2. En la Figura 5.11 los primeros cuatro períodos del pronóstico pudieron ser comparados contra datos de validación, el rectángulo muestra tal comparación y los siguientes ocho períodos pronosticados indican la tendencia de la demanda de acuerdo al modelo de RNA. Para este caso se utilizaron las mismas herramientas computacionales que en el caso del Capítulo 4. Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos 87 5.3. Conclusiones En este trabajo, se analizaron dos series de tiempo reales, que corresponden al comportamiento de la demanda en una industria de telecomunicaciones. El análisis y pronóstico de las mismas fue realizado mediante una RNA de múltiples salidas construida mediante la aplicación de la metodología propuesta en el Capítulo 3. Se obtuvieron modelos de RNA confiables, con pronósticos de calidad que en el Capítulo 6 serán comparados con pronósticos realizados mediante algunos modelos lineales tradicionales. Los resultados de este caso pueden ser reproducidos fácilmente aplicando la metodología propuesta, inicializando los pesos de las conexiones de RNA sistemáticamente y seleccionando de manera aleatoria de acuerdo a una distribución uniforme sin reemplazo el conjunto de patrones de validación. Tanto la inicialización como la selección del conjunto de validación son parte de la contribución de esta tesis. CAPÍTULO 6 COMPARACIÓN DE RESULTADOS DE RNAs CONTRA MÉTODOS LINEALES TRADICIONALES Introducción En este capítulo, se reportan los resultados del análisis de las series de tiempo correspondientes a la demanda en la empresa de telecomunicaciones mediante la utilización de algunos métodos lineales tradicionales tales como: método ingenuo, método del promedio, promedios móviles, regresión lineal simple, suavizado exponencial simple y suavizado exponencial doble. Este análisis fue llevado a cabo por María Guadalupe Villarreal Marroquín durante un proyecto del Verano Científico apoyado por el Provericyt -UANL (Proyecto PAICYT CA1069-05) con el fin de sustentar los resultados obtenidos a través de la aplicación de RNAs para pronóstico de series de tiempo. 88 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales 89 Cabe destacar que la manera en que se analizaron las series de tiempo en los métodos lineales utilizados estuvo acorde con los requerimientos propios de estos métodos. Por tanto, el manejo de las series mediante RNAs fue hecho bajo consideraciones distintas. Sin embargo, esta comparación resulta objetiva, pues el trabajo realizado mediante los métodos lineales fue desarrollado de manera independiente al que se realizó con las RNAs. En la Sección 6.1, se presentan los resultados obtenidos al pronosticar mediante modelos lineales el comportamiento de la demanda para un solo período, tomando como base la serie presentada en la Figura 4.1. Dichos resultados fueron comparados con los obtenidos a través del modelo de RNA desarrollado en el Capítulo 4. La Sección 6.2, contiene los resultados de los modelos lineales utilizados en el pronóstico de la demanda de doce períodos tomando como base las series mostradas en la Figura 5.1 y Figura 5.2 (analizadas en el Capítulo 5). Además, se incluye la comparación de los resultados de los modelos de RNAs obtenidos en el Capítulo 5 contra el mejor resultado obtenido a partir de los métodos lineales utilizados. Se observó que los modelos de RNAs obtuvieron mejores resultados que los métodos lineales utilizados. 6.1. Pronóstico de demanda de un período en telecomunicaciones mediante métodos lineales tradicionales Con el fin de aproximar la serie mostrada en la Figura 4.1 (Serie 1) y generar un pronóstico para el siguiente período se utilizaron diferentes métodos lineales buscando obtener un pronóstico de buena calidad para compararlo posteriormente con los resultados obtenidos en el Capítulo 4. En dicho capítulo se desarrolló un modelo de RNA mediante el ajuste de parámetros a través de técnicas estadísticas y de optimización. Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales 90 La Tabla 6.1 contiene los resultados obtenidos mediante métodos lineales. La segunda columna contiene el valor del pronóstico, la tercera muestra el valor del MSE, la cuarta el MAE, la quinta y sexta contienen el valor de S_Pred y B_Pred respectivamente. Todas estas medidas se definieron previamente en el Capítulo 4. Tabla 6.1: Resultados del análisis de la Serie 1 par el pronóstico de un solo período. Método Pronóstico MSE MAE S_Pred B_Pred Método Ingenuo 424.000 850.894 16.864 126.000 78.000 Método Promedio 431.866 36814.707 168.041 7.985 327.943 Promedios Móviles n=5 546.000 2214.707 37.226 171.400 98.800 Promedios Móviles n=8 588.750 3657.836 50.506 192.500 113.500 Promedios Móviles n=10 598.300 4957.120 60.130 199.900 125.200 Suavizado Exponencial Simple 423.531 850.881 16.865 126.000 77.973 Regresion Lineal 740.353 4579.486 51.206 307.280 95.671 Suavizado Exponencial Doble 423.257 700.782 15.667 128.948 66.586 Analizando la Tabla 6.1, fue posible determinar cuál de los métodos utilizados tenía mejor desempeño en la aproximación y pronóstico de la Serie 1. Sin lugar a duda, el suavizado exponencial doble adquirió mejor valor en las medidas de desempeño utilizadas. De esta manera, seleccionamos este método como el mejor de los métodos lineales utilizados en el análisis de la Serie en cuestión. A continuación se describe la comparación del modelo de RNA contra el Suavizado Exponencial Doble. 6.1.1. Comparación de Resultados Los resultados obtenidos al utilizar el suavizado exponencial fueron comparados contra los que se obtuvieron mediante el modelo de RNA que se construyó en el Capítulo 4 para la Serie 1 (Figura 4.1), la Tabla 6.2 muestra tal comparación. El modelo de RNA fue un modelo de tres capas entrenado por retropropagación del error, las Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales 91 función de transferencia en la capa oculta fue la tangente hiperbólica (Ecuación 4.2) y en la capa de salida fue la función identidad (Ecuación 4.3); los datos se manejaron en escala [-1, 1] y se utilizaron como entrada las diferencias de la demanda registrada en los últimos 6 períodos con 7 neuronas en la capa oculta y el algoritmo de entrenamiento fue el lm. Tabla 6.2: Modelo de RNA vs. Suavizado Exponencial Doble en el pronóstico de un solo período, Serie 1. Modelo Suavizado Exponencial Doble RNA Pronóstico Real MSE MAE S_Pred B_Pred 423.257 424 700.78 15.66 128.94 66.58 424 424 0.80 1.68 4.68 5.04 Se pudo observar que existe una diferencia muy grande en cuanto a la calidad de aproximación de la RNA y el método lineal. Por esta razón, la comparación favorece a la RNA construida mediante la metodología propuesta para la selección de parámetros en la serie de tiempo analizada. La Figura 6.1 muestra de manera gráfica la comparación de los resultados de la Tabla 6.2. Se aprecia que en este caso de pronóstico de un solo período, la diferencia existente entre el pronóstico de la RNA y el método de suavizado exponencial doble es pequeña, sin embargo en los resultados para pronóstico de doce períodos este método resultó con pobre desempeño como se verá en los resultados de la siguiente sección. Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales Suavizado Exp. Doble RNA Real 92 800 Unidades de Demanda 700 600 500 400 300 200 100 0 1 7 13 19 25 31 37 43 49 55 61 67 Tiempo (meses) Figura 6.1: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en el Análisis de la Serie 1, un solo período. 6.2. Pronóstico de Demanda de n períodos en telecomunicaciones mediante métodos lineales tradicionales Cuando se desea pronosticar no sólo el siguiente período sino varios períodos siguientes, existen también diversos métodos que permiten llevar a cabo la estimación del comportamiento de la serie con un horizonte de pronóstico a largo plazo. En nuestro caso, utilizamos el método de regresión lineal y el método de suavizado exponencial doble. Ambos brindan la capacidad de calcular de manera directa el número de períodos deseados en el horizonte de planeación. Los modelos fueron desarrollados para pronosticar 12 períodos y la medida de desempeño utilizada para cuantificar la calidad de aproximación de los modelos utilizados fue el MSE. Los resultados obtenidos durante el análisis de la Serie 1 (Figura 5.1) se muestran en la Tabla 6.3. En la primer columna se indica la técnica utilizada, la segunda columna contiene el valor de la medida de desempeño MSE y las siguientes doce columnas contienen el pronóstico de la demanda para los siguientes doce períodos de tiempo. Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales 93 Tabla 6.3: Resultados del análisis de la Serie 1 para el pronóstico de 12 períodos. Método Método de Regresión MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes Mes Mes 10 11 12 4579.4 740.3 749.4 758.4 767.5 776.6 785.7 794.7 803.8 812.9 822.0 831.0 840.1 Suavizado Exponencial Doble 700.7 413.2 370.5 327.8 285.1 242.4 199.6 156.9 114.2 71.5 28.8 -13.8 -56.5 Observando los resultados de la Tabla 6.3, en el análisis de la Serie 1 se concluyó que el método con mejor desempeño fue el de suavizado exponencial doble, sin embargo, viendo con mayor detenimiento los pronósticos que fueron estimados mediante esta técnica, nos encontramos que para los meses 11 y 12 da como pronóstico valores negativos. Estos resultados no tienen sentido en nuestro análisis, pues la serie analizada representa el comportamiento de la demanda de un servicio. Lo que nos llevó a concluir que el Suavizado Exponencial nos llevaría a resultados no deseados en el pronóstico de la Serie 1 a largo plazo. Así que aunque el MSE del método de regresión era muy grande, lo consideramos para propósitos de comparación. Para analizar estadísticamente la Serie 2 correspondiente a la Figura 5.2, utilizamos nuevamente las técnicas de regresión lineal y suavizado exponencial doble, en la Tabla 6.4 se muestran de manera detallada los resultados obtenidos. Tabla 6.4: Resultados del análisis de la Serie 2, para el pronóstico de 12 períodos. Método Método de Regresión MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes Mes Mes 10 11 12 541.70 164.8 167.1 169.3 171.6 173.8 176.0 178.3 180.5 182.8 185.0 187.3 189.5 Suavizado Exponencial Doble 221.5 96.2 97.8 99.3 100.9 102.4 104.0 105.6 107.1 108.7 110.2 111.8 113.3 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales 94 Analizando los resultados de la Tabla 6.4, se optó por elegir el método de suavizado exponencial doble, pues resultó con un MSE menor que el método de regresión y los valores de pronóstico fueron razonables para el análisis de la Serie 2. 6.2.1. Comparación de Resultados Considerando un horizonte de planeación de 12 periodos, en el Capítulo 5 fueron construidos modelos de RNAs con múltiples salidas para pronosticar doce valores de demanda mediante el análisis de las Series 1 y 2 (Figura 5.1 y Figura 5.2 respectivamente). En la Tabla 6.5 se muestra la comparación de los resultados obtenidos. La segunda fila contiene los resultados obtenidos mediante el método lineal, la tercera contiene los que se obtuvieron a partir del modelo de RNA y en la última fila están valores reales de la demanda que se registró en los cuatro períodos posteriores al último dato contenido en la Serie 1 (ver Figura 5.1). Estos últimos fueron brindados por la empresa, con el fin de validar los resultados de ambas técnicas: RNAs y métodos lineales tradicionales. En la Figura 6.2 se presentan los resultados de esta comparación de manera gráfica. Tabla 6.5: Modelo de RNA vs Método Tradicional vs Modelo Real en el análisis de la Serie 1. Método MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes Mes Mes 10 11 12 Método de Regresión 4579.4 740.3 749.4 758.4 767.5 776.6 785.7 794.7 803.8 812.9 822.0 831.0 840.1 RNA Real 211.5 528.4 540.6 555.7 566.4 584.4 599.7 609.2 614.2 627.5 638.4 653.8 675.2 455.0 458.0 465.0 472.0 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales 95 Se puede observar que los resultados obtenidos mediante el modelo de RNA para el análisis y pronóstico de 12 períodos de la Serie 1 construido a partir de la metodología propuesta nos condujo a mejores resultados que el mejor de los métodos lineales utilizados. Real RNA Método de Regresión 900 Unidades de Demanda 800 700 600 500 400 300 200 100 0 1 7 13 19 25 31 37 43 49 55 61 67 73 79 Tiempo (meses) Figura 6.2: Comparación del pronóstico de RNAs vs. Método de Regresión en el Análisis de la Serie 1, doce períodos. A continuación en la Tabla 6.6 se muestra de manera semejante a la anterior los resultados obtenidos a través de los diferentes métodos durante el análisis de la Serie 2 y en la Figura 6.3 se presentan en forma gráfica. Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales 96 Tabla 6.6: Comparación de Resultados, Modelo de RNA vs Método Tradicional vs Modelo Real, Serie 2. Método MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Suavizado Exponencial Doble 221.5 96.2 97.8 99.3 100.9 102.4 104.0 105.6 107.1 108.7 110.2 111.8 113.3 RNA 106.2 157.6 163.3 162.2 164.3 165.1 Real 150.0 149.0 151.0 155.0 166 173.0 176.3 185.9 191.0 106.2 157.6 Suavizado Exp. Doble RNA Real Mes Mes Mes 10 11 12 800 Unidades de Demanda 700 600 500 400 300 200 100 0 1 7 13 19 25 31 37 43 49 55 61 67 73 79 Tiempo (meses) Figura 6.3: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en el Análisis de la Serie 2, doce períodos. Nuevamente, los resultados obtenidos mediante el modelo de RNA para el análisis y pronóstico de 12 períodos de la Serie 2, son mejores que los de los métodos lineales utilizados. Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales 97 6.3. Conclusiones Al realizar la comparación de los modelos de RNAs construidos a través de la metodología propuesta en el Capítulo 3 comprobamos que para nuestro caso de estudio de pronóstico de demanda de telecomunicaciones para uno y doce periodos futuros, los modelos de RNA permitieron obtener pronósticos mucho más confiables que los obtenidos mediante métodos lineales tradicionales. Lo anterior, sustenta la validez del método propuesto. CAPÍTULO 7 INSTAURACIÓN DE LA HERRAMIENTA DE SOPORTE A LA TOMA DE DECISIONES Introducción En este capítulo se explica de manera general la implementación computacional que se llevó a cabo en el desarrollo de la metodología descrita en el Capítulo 3. La herramienta que se presenta en la Figura 7.1, fue creada y utilizada para generar y ejecutar el diseño de experimentos de RNAs para el pronóstico de múltiples períodos. Al implementar dicha herramienta se obtuvieron grandes beneficios, pues no es necesaria la interacción del usuario durante la ejecución del experimento y su intervención se limita a proporcionar la delimitación del área experimental, así como los valores de la serie de tiempo. 98 Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones 99 La codificación fue realizada en Matlab 7.0.4. A continuación se presenta la descripción general de la herramienta y el código fuente está disponible en el Apéndice C. La fase de análisis de varianza y optimización se realizó en Minitab y Excel Solver respectivamente. 7.1. Descripción de la herramienta de soporte a la toma de decisiones El objetivo de la codificación de la herramienta de soporte de decisiones fue brindarle al tomador de decisiones una herramienta que sustente y oriente las decisiones de planeación de capacidad de una red de transmisión, sin necesidad de conocer a detalle la modelación mediante RNAs para pronóstico de series de tiempo. Se llevó a cabo la construcción de un prototipo que se encarga de generar y ejecutar un diseño de experimentos de tipo factorial (Figura 7.1) que constituye la parte fundamental de la metodología propuesta en el Capítulo 3. Para ejecutar el proceso de la Figura 7.1 el usuario requiere especificar las siguientes entradas: • Datos: Corresponde a los valores de la demanda registrados a lo largo del tiempo (serie de tiempo). Se especifica en forma de vector columna o bien, se da el nombre del archivo .xls o .m que contiene tal vector. Este archivo debe estar en el espacio de trabajo actual. • Especificaciones de los factores: En nuestro caso, los factores que formarán parte del diseño de experimentos son lags y neuronas. Así que es necesario introducir los valores específicos que toman estos factores en cada uno de los niveles definidos dentro del rango experimental. • Resultados: Corresponde al nombre de un archivo .xls en el cual se almacenará en forma de tabla los resultados del experimento. Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones Datos Especificaciones de los factores 100 Resultados Generar Combinación Factorial Selección del Conjunto de Validación Inicialización de la RNA Entrenamiento de la RNA Validación de la RNA y Pronóstico Guardar RNA y medidas de desempeño ¿Otro punto de inicio? Sí No Selección del mejor modelo de RNA Mostrar Resultados No Guardar en Resultados ¿Factorial Completo? Si Terminar Figura 7.1: Generador y ejecutor de un Experimento Factorial. Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones 101 Por ejemplo, si la serie de datos está contenida en un archivo llamado ‘Serie.m’ y el experimento se desarrollará con tres niveles de cada factor con valores específicos de lags = {2, 5, 7} y neuronas= {3, 5, 8} y se quiere almacenar los resultados en el archivo ‘salida.xls’. Se introduce en la línea de comandos: Hacer_Experimento(Serie, [2 5 7],[3 5 8], ‘salida.xls’) De esta forma, el programa Hacer_Experimento realiza lo siguiente: • Generar combinación factorial: Fija el factor lags en un nivel y recorre cada uno de los niveles de neuronas. Cuando se han recorrido todos los niveles de neuronas, entonces se recorre el factor lags al siguiente nivel y vuelve a recorrer neuronas. Se realiza sucesivamente hasta terminar las posibles combinaciones de los factores. Cuando se tiene una combinación factorial, se procede a preprocesar los datos de manera que estén contenidos en la región [-1, 1]. Se lleva a cabo la construcción de patrones cuya cantidad dependerá de la cantidad de datos contenidos en ‘Serie’, el número de lags y la cantidad de salidas de la RNA (que en nuestro caso son 12). Ya que se tienen todos los patrones disponibles para el análisis, se separan en dos conjuntos: conjunto de entrenamiento y conjunto de validación, para llevar a cabo la técnica de validación cruzada. • Selección del conjunto de validación: Puesto que ya se conoce la cantidad de patrones disponibles, se selecciona de manera aleatoria de acuerdo a una distribución uniforme sin reemplazo aquéllos patrones que formarán parte del conjunto de validación. En nuestro caso usamos aproximadamente el 30% de los patrones disponibles. Los patrones no seleccionados conformarán el conjunto de entrenamiento. El programa Selección, es el que se encarga de construir las matrices de entrenamiento y de validación del modelo de RNA. En este momento ya se tiene información suficiente que permite comenzar el proceso de construcción del modelo de RNA. Se utiliza una RNA de tres capas con retropropagación con función de transferencia tangente hiperbólica en la capa oculta y función identidad en la capa de salida. La RNA se construye como sigue: Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones • 102 Inicialización de la RNA: Fija los valores iniciales de las conexiones de la RNA. Como se explicó en el Capítulo 5, en nuestro caso tenemos 7 puntos de inicio para la RNA, así que se inicializa en cada uno de ellos para llevar a cabo su entrenamiento y validación. Posteriormente se seleccionará la RNA con mejor desempeño. • Entrenamiento: La actualización de las conexiones se realizará mediante el algoritmo de Levenberg - Marquardt (lm), para minimizar el error de aproximación conocido como MSE. Se consideran sólo los patrones del conjunto de entrenamiento con el objetivo de minimizar la función de error, para obtener una buena aproximación del modelo que está detrás del comportamiento de los datos. Terminada la actualización de pesos, se realiza el post- procesamiento de la información para calcular la medida de desempeño MSE_T, correspondiente a la RNA. • Validación y Pronóstico: Considerando los patrones del conjunto de validación, se alimenta a la RNA resultante del entrenamiento anterior. Obtenemos las salidas de la RNA, post-procesamos las salidas y calculamos el MSE_V. Para realizar el pronóstico consideramos los últimos datos históricos (pre procesados) registrados en la Serie de acuerdo al valor del factor lags, los alimentamos a la RNA y calculamos las salidas de la RNA. Llevamos a cabo el post- procesamiento para obtener así el pronóstico de los siguientes 12 períodos. • Guardar RNA y medidas de Desempeño: Se almacenan en archivos temporales los resultados del entrenamiento, validación y pronóstico. Posteriormente se recurrirá a ellos para obtener sólo el que contenga la RNA con mejor desempeño, el resto de los archivos será depurado. • ¿Otra inicialización?: Puesto que tenemos 7 puntos de inicio para los modelos de RNA, si aún no se han construido los 7 modelos diferentes de RNA para la actual combinación de factores, se procede a la inicialización de la RNA en otro punto distinto. De lo contrario, se procede al siguiente paso: • Selección del mejor modelo de RNA: De los modelos correspondientes a la combinación actual de factores, se selecciona el modelo de RNA con menor MSE_V, así obtenemos el modelo de RNA con mayor poder de generalización Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones 103 para esa combinación de factores. Se eliminan los archivos temporales y se conserva sólo el que contiene el modelo de RNA seleccionado. • Mostrar Resultados: Despliega en pantalla un gráfico que contiene los datos históricos de la demanda, así como el pronóstico obtenido por el modelo seleccionado. • Guardar en Resultados: Actualiza el archivo ‘salida.xls’, coloca la combinación de factores, el valor de las medidas de desempeño correspondientes a esa combinación así como el valor del pronóstico para los siguientes 12 períodos del modelo seleccionado. • ¿Factorial Completo?: Si aún no se han elaborado modelo de RNA con todas las combinaciones posibles de lags y neuronas, se procede a Generar Combinación Factorial, de lo contrario el procedimiento termina. • Terminar: Concluye la ejecución del experimento. Al finalizar, el tomador de decisiones tendrá disponible el archivo ‘salida.xls’ que contiene los resultados del experimento. De acuerdo a la metodología, se procede a la caracterización de resultados mediante el análisis de varianza. Se obtienen los metamodelos para llevar a cabo la optimización de las medidas de desempeño de la RNA, así se determina el valor al cual deben fijarse los parámetros para que la RNA brinde pronósticos confiables. El análisis de varianza se puede ejecutar en cualquier paquete estadístico, en nuestro caso se utilizó Minitab. La optimización de los modelos de RNA resultantes se puede realizar en cualquier herramienta de optimización no lineal entera, el solver de Excel fue suficiente para el propósito de este trabajo. Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones 104 7.2 Conclusiones Con la automatización del generador y ejecutor de experimentos, el usuario lo único que tiene que hacer es brindar la información histórica de la serie y especificar los valores de los parámetros, el resto de las decisiones las toma el programa. Por tanto, es una herramienta muy sencilla de manejar que no exige conocimiento previo acerca de la modelación de series de tiempo mediante RNAs. Queda al usuario crear los metamodelos y llevar a cabo la optimización. Estos procedimientos pueden automatizarse en un futuro considerando la salida de la codificación aquí descrita. CAPÍTULO 8 CONCLUSIONES, CONTRIBUCIÓN Y TRABAJO FUTURO En este trabajo, se propuso una metodología para seleccionar los parámetros que intervienen en la construcción y utilización de RNAs para pronóstico de series de tiempo. La metodología propuesta utiliza conceptos de diseño de experimentos, análisis de varianza, y optimización no lineal. Se pudo demostrar que la metodología trabaja bien por medio de un caso práctico de predicción de demanda en la industria de las telecomunicaciones. Dentro de las características atractivas de la metodología se encuentra que: (1) utiliza técnicas establecidas y confiables, (2) puede instaurarse sin necesidad de una codificación especializada y (3) hace entendible la interrelación entre los varios parámetros de la RNA. Se analizaron dos series de tiempo reales que corresponden al comportamiento de la demanda en una industria de telecomunicaciones. El análisis y pronóstico de las mismas fue realizado mediante una RNA de múltiples salidas construida mediante la aplicación de la metodología propuesta. Se obtuvieron modelos de RNA confiables, con 105 Capítulo 8. Conclusiones, Contribución y Trabajo Futuro 106 pronósticos de calidad que fueron comparados con pronósticos realizados mediante procedimientos lineales tradicionales y valores reales. Al realizar la comparación de los modelos de RNAs construidos a través de la metodología propuesta, comprobamos que para nuestro caso de estudio de pronóstico de demanda de telecomunicaciones para uno y doce periodos futuros, los modelos de RNA permitieron obtener pronósticos mucho más confiables que los obtenidos mediante métodos lineales tradicionales. Estos resultados sustentan la validez del método propuesto. La metodología propuesta tiene la ventaja de permitir reproducir los resultados fácilmente aplicándola de manera sistemática, inicializando los pesos de las conexiones de RNA en los valores propuestos y seleccionando de manera aleatoria de acuerdo a una distribución uniforme sin reemplazo el conjunto de patrones de validación. Se automatizó el generador y ejecutor de experimentos haciendo aún más sencilla la construcción del modelo de RNA. El usuario lo único que tiene que hacer es brindar la información histórica de la serie y especificar los valores de los parámetros, el resto de las decisiones las toma el programa. Por tanto, es una herramienta muy sencilla de manejar que no exige conocimiento previo acerca de la modelación de series de tiempo mediante RNAs. La principal contribución de esta tesis fue la metodología propuesta, pues hasta donde tenemos conocimiento nunca ha sido aplicada para la selección de parámetros de una RNA. Además, se resolvió un problema real de una empresa de telecomunicaciones. Otra característica atractiva es la inicialización sistemática de los pesos de las conexiones pues brinda la posibilidad de reproducir los resultados. Por otra parte, la forma en que fue seleccionado el conjunto de validación es provechosa y objetiva, ya que al ser de manera aleatoria, el diseñador del modelo no influye en la selección de los patrones que se utilizarán para probar la capacidad de generalización de la RNA. En el desarrollo del modelo de RNAs para pronóstico de múltiples períodos obtuvimos resultados empíricos que mostraron un pobre desempeño de la técnica iterativa que utiliza RNAs con una salida para pronosticar más de un período. También Capítulo 8. Conclusiones, Contribución y Trabajo Futuro 107 se obtuvo pobre desempeño en la técnica que usa modelos de RNA independientes para cada horizonte de pronóstico con el fin de pronosticar múltiples períodos. De acuerdo a lo anterior, concluimos que para el pronóstico de múltiples períodos es mejor utilizar modelos de RNAs con múltiples salidas. Por supuesto, queda abierta esta línea de demostrar teóricamente estas conclusiones. Como trabajo futuro se pueden encontrar intervalos de confianza para los pronósticos que se obtienen mediante el modelo de RNA construido a través de la metodología propuesta. Sería además interesante utilizar la metodología propuesta con diferentes tipos de RNAs. Otra extensión potencial de este trabajo es la automatización de los procesos de análisis de varianza y optimización. BIBLIOGRAFÍA Al-Saba Tawfiq and El-Amin Ibrahim, “Artificial neural networks as applied to long-term demand forecasting”, Artificial Intelligent in engineering, Vol. 13, 1999, pp. 189-197. Ashu Jain, Ashish Kumar, and Umesh Chandra Joshi, “Short-Term Water Demand Forecast Modelling at IIT Kanpur Using Artificial Neural Networks”, Water Resources Management Vol. 15, Num.5 , 2001, pp. 299-321. Bishop C. M., Neural networks for pattern recognition. Oxford University Press, Oxford, UK, 1995. Borwein J. M., and Lewis A. S., Convex Analysis and Nonlinear Optimization, Springer, Verlag-New York, Inc, 2000. Box G. E. P., and Jenkins G. M., Time series Analysis: Forecasting and control, San Francisco, CA: Holden-Day, EUA, 1976. Cabrera-Ríos M., Castro J. M., and Mount-Campbell C. A., “Multiple quality criteria optimization in in-mold coating (IMC) with a data envelopment analysis approach”, Journal of Polymer Engineering, Vol. 22, No. 5, 2002, pp. 305- 340. Cabrera-Ríos M., Castro J. M., and Mount-Campbell C. A., “Multiple quality criteria optimization in reactive in-mold coating with a data envelopment analysis approach II: a case with more than three performance measures”, Journal of Polymer Engineering, Vol. 24, No. 4, 2004, pp. 435-450. 108 Bibliografía 109 Castro C. E., Cabrera-Ríos M., Lilly B., Castro J. M., and Mount-Campbell C. A., “Identifying the best compromise between multiple performance measures in injection holding (IM) using data envelopment analysis (DEA)”, Journal of Integrated Design and Process Science, Vol. 7, No. 1, 2003, pp. 77-87. Castro J. M., Cabrera-Ríos M., and Mount-Campbell C. A., “Modelling and Simulation in reactive polymer processing”, Modelling and Simulation in Materials Science and Engineering, Vol. 12, No. 3, 2004, pp. S121-S149. Cigizoglu H. Z., “Incorporation of ARMA models into flow forecasting by artificial neural networks”, Environmetrics, Vol. 14, Num. 4, 2003, pp. 417-427. Cybenko G., “Approximation by superpositions of sigmoidal function”, Mathematical Control Signals Systems, Num. 2, 1989, pp.303-314. Daliakopoulos Ioannis N., Coulibaly Paulin, and Tsanis Ioannis K., “Groundwater level forecasting using artificial neural networks”, Journal of Hydrology, Vol. 309, Num. 1-4, 2005, pp. 229-240. Deb K., Multi-Objective Optimization using evolutionary algorithms, Editorial Wiley, N.Y., EUA, 2004. Devore J. L., Probability and Statistics for Engineering the Sciences 4ta Edición, Duxbury Press, California Polytechnic State University, EUA, 1995. Duhoux M, Suykens JAK, De Moor B, and Vandewalle J, “Improved long-term temperature prediction by chaining of neural networks”, Int J Neur Sys, Vol. 11, No. 1, 2001, pp. 1-10. Floudas C. A., Nonlinear and Mixed- Integer Optimization, Oxford, N.Y., 1995. Gardner M. W., and Dorling S. R., “Artificial neural networks (the multi-layer perceptron)- a review of applications in the atmospheric sciences”, Atmospheric Environment, Vol. 33, 1999, pp. 709-719. Bibliografía 110 Ghaziri Hassan M., Optimización Heurística y Redes Neuronales, Editado por Díaz Fernández Adenso, Madrid, España, 1996. Ghiassi M., and Saidane H., “A dynamic architecture for artificial neural networks”, Neurocomputing, Vol. 63, 2005, pp. 397-413. González Pedro, and Zamarreño Jesús, “Prediction of hourly energy consumption in buildings based on a feedback artificial neural network”, Energy and Building, Vol. 37, 2005, pp. 595-601. Granger C. W. J., “Strategies for modelling nonlinear time-series relationships”, The Economic Record, Vol. 69, Num. 206, 1993, pp. 233-238. Gutiérrez-Estrada Juan C., De Pedro-Sanz Emiliano, López-Luque Rafael and Pulido-Calvo Inmaculada, “Comparation between tradicional methods and artificial neural networks for ammonia concentration forecasting in an eel (Anguilla anguilla L.) intensive rearing system”, Aquacultural Engineering, Vol. 31, 2004, pp. 183-203. Hagan M. T., Demuth H. B., and Beale M., Neural network design, PWS Publising Company, EUA, 1996. Hanh H. Nuguyen and Christine W. Chan, “Multiple neural networks for a long time series forecast”, Neural Comput &Applic, Vol. 13, 2004, pp. 90-98. Hansen J. V., and Nelson R. D., “Forecasting and recombining time-series components by using neural networks”, Journal of the Operations Research Society, No. 54, 2003, pp. 307-317. Hill, T., W. Remus, and M. OπConnor, "Neural Network Models for Time Series Forecasts", Management Science, Vol. 42, Num. 7, 1996, pp. 1082-1092. Hillermeier C., Nonlinear Multiobjective Optimization: a generalized homotopy approach, Basel: Birkhauser Verlag, 2001. Bibliografía 111 Hornik K., Stinchcombe M., and White H.,“Multilayer feedforward networks are universal approximators”, Neural Networks, Vol. 2, No. 5, 1989, pp. 359-366. Hu M. J. C., “Application in the Adaline system to weather forecasting”, Master Thesis, Technical Report 6775-1, Stanford electronic Laboratories, Stanford, CA, Junio de 1964. Huang W., Xu B., and Chan-Hilton A., “Forecasting flows in Apalachicola River using neural networks”, Hydrological Processes, Vol. 18, 2004, pp. 2545-2564. Hwarng H. B., “Insights into neural-network forecasting of time series corresponding to ARMA (p,q) structures”, Omega: The International Journal of Management Science, Vol. 29, No. 3, 2001, pp. 273-289. Irie B., and Miyake S., “Capabilities of three-layered perceptrons”, Proccedings of the IEEE International Conference on Neural Networks I, 1988, pp. 641-648. Kolehmainen M., Martikainen H., Russkanen J., “Neural networks and periodic components used in air quality forecasting“, Atmospheric Environment, Vol. 35, 2001, pp. 815-825. Liao K-P, and Fildes R., “The accuracy of a procedural approach to specifying feedforward neural networks for forecasting”, Computers & Operations Research, Vol. 32, No. 2, 2005, pp. 151-2169. Luenberger D. G., Introduction to linear and nonlinear optimization programming, Addison- Wesley Publishing Company, 1973. Maier H. R., and Dandy G. C., “Neural networks for the prediction and forecasting of water resources variables: a review of modelling issues and applications”, Environment Modelling & Software, Vol. 15, 2000, pp. 101-124. Makridakis S., and Wheelwright S. C., The handbook of forecasting a manager’s guide, Segunda edición, Editorial Wiley, N.Y., EUA 1987. Bibliografía 112 Makridakis S., Anderson A., Carbone R., Fildes R., Hibbon M., Lewandowski R., Newton J., Parsen E., and Winkley R., “The accuracy of extrapolation (time series) methods: Results of a forecasting competition”, Journal of Forecasting, Vol. 1, 1982, pp. 111-153. Martínez Martínez Garza Ángel, Diseños Experimentales: métodos y elementos de teoría, Editorial Trillas, México, 1988. McCulloch W. S., and Pitts W., “A logical calculus of the ideas imminents in nervous activity ”, Bulletin and Mathematical Biophysics, Vol. 5, 1943, pp. 115133. Medeiros M. C., and Pedreira C. E., “What are the effects of forecasting linear time series with neural networks”, Logistic and Transportation Review, Vol. 31, No. 3, 2001, pp. 239-251. Montgomery Douglas C., Diseño y Análisis de Experimentos, Segunda Edición, Editorial Limusa Wiley, México D. F., 2004. Nelson, M., T. Hill, W. Remus and M. O'Connor, "Time Series Forecasting Using Neural Networks: Should the Data Be Deseasonalized First?", Journal of Forecasting, 1999, Vol.18, Num.5, pp. 359-370. Niska Harri, Hiltunen Teri, Karppinen Ari, Russkanen J. and Kolehmainen M., “Evolving the neural network model for forecasting air pollution time series”, Engineering Applications of Artificial Intelligence, Vol. 17, 2004, pp. 159-167. Piramuthu S., H. Ragavan, and M. Shaw, “Using feature construction to improve the performance of neural networks”, Management Science, Vol. 44, No. 3, 1998, pp. 416-430. Qi Min and Zhang G. P., “An investigation of model selection criteria for neural network time series forecasting”, European Journal of Operation Research, Vol. 132, 2001, pp. 666-680. Bibliografía 113 Qing Cao, Karyl B. Leggio and Marc J. Schniederjans, “A comparation between Fama and Frech’s model and artificial neural networks in predicting the Chinese stock market”, Computers & Operation Research, Vol. 32, 2005, pp. 2499-2512. R. J. Kuo and k. C. Xue, “Fuzzy neural networks with application to sales forecasting”, Fuzzy sets and y systems, Vol. 108, Num. 2, 1999, pp. 123-143. Rumelhart D-E., Hinton G. E., and Willians R. J., “Learning representartions by backpropagating errors”, Nature, 323 (6188), 1986, pp. 533-536. Sexton R. S., McMurtrey S., Michalopoulos J. O., and Smith A. M.,“Employee turnover : a neural network solution”, Computers & Operations Research, Vol. 32, No. 10, 2005, pp. 2635-2651. Smith K. A. and Gupta JND, “Neural networks in business: techniques and applications for the operations researcher”, Computers and Operations Research, Vol. 27, Num. 11-12, 2000, pp.1023-1044. Sözen Adnan, Arcaklioglu Erol, Özalp Mehmet, and Çaglar Naci, “Forecasting based neural network approach of solar potential in Turkey”, Renewable Energy, Vol. 30, Num.7, 2005, pp. 1075-1090. Werbos P. J., “Generalization of backpropagation with applications to a recurrent gas market model”, Neural Networks, Vol. 1, 1988, pp. 339-356. West D., Dellana S., and Qian J., “Neural networks strategies for financial decision applications”, Computers & Operations Research, Vol. 32, 2005, pp.2543-2559. White H., “Connectionist nonparametric regression: Multilayer feedforward networks can learn arbitrary mappings”, Neural Networks, Vol. 3, No. 5, 1990, pp. 535-549. Bibliografía 114 Widrow B., Rumelhart D., and Lehr M. A., “Neural networks: Applications in industry, bussines and science”, Communications of the ACM, Vol. 37, No. 3, 1994, pp. 93-105. Zhang G. P., and Hu M. Y., “A simulation study of artificial neural networks for nonlinear time series forecasting”, Computers & Operations Research, Vol. 28, 2001, pp. 381-396. Zhang G. P., Neural Networks in Business Forecasting, Idea Group Publishing, Georgia State University, EUA, 2004. Zhang G., Patuwo E., and Hu Y. M., “Forecasting with artificial neural networks the state of the art”, International Journal of Forecasting, Vol.14, No. 1, 1998, pp. 35-62. LISTA DE FIGURAS 1.1. Descripción del problema de Telecomunicaciones. ………...………………….. 2 1.2: Ejemplo de una Serie de Tiempo. ………....………………………………….…. 3 2.1: Neurona Biológica. ………………………………………...………………….. 10 2.2: Neurona Artificial. ………...………………………………………………….... 11 2.3: RNA multicapa de propagación hacia adelante. ………...……………...…….. 12 2.4: Modelo general de un proceso o sistema. ………...……………………...…….. 21 2.5: a) Función convexa y b) Función estrictamente convexa. ...………………….. 25 2.6: Función no convexa. ………...……………………………………………..….. 25 2.7: Representación Gráfica de un Problema de Optimización Multicriterio. ……... 27 3.1: Metodología Propuesta para la Selección de Parámetros en RNAs. ………….. 30 4.1: Serie de tiempo del comportamiento de la demanda. ………………….……… 39 4.2: Red Neuronal Artificial de propagación hacia adelante, entrenada por retropropagación del error de pronóstico, con tres capas. ………...…………..…… 41 4.3: Gráficas para comprobación de normalidad e independencia estadística de los residuos en el modelo de regresión de la B_Pred. ………...………………………... 115 51 Lista De Figuras 116 4.4: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza en los residuos del modelo de regresión de la B_Pred. ………...………………….….. 52 4.5: Modelo de RNAs vs Modelo Real. ………...………………………………….. 55 5.1: Comportamiento de la demanda, Serie 1. …..……...………………………….. 59 5.2: Comportamiento de la demanda, Serie 2. ………...…………………….……... 60 5.3: Red neuronal artificial de propagación hacia adelante, entrenada por retropropagación del error de pronóstico con tres capas y múltiples salidas. ……... 62 5.4: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V experimental en la Serie 1. ………...……………………………………...……….. 69 5.5: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V en el experimento enfocado. ………...…………………………..……………...……….. 72 5.6: Superficie de los metamodelos para el MSE_T y MSE_V antes y después del enfoque del Experimento. ………...……………………………………...……….... 73 5.7: Pronóstico del modelo de RNA definitivo, Serie 1. ………...……………….... 76 5.8: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V experimental en la Serie 2. ………...……………………………………...……….. 80 5.9: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V en la Serie 2 (experimento enfocado). …...……………………………………...……….. 83 5.10: Gráfica del MSE_T vs MSE_V en la Serie 2. ………………………..……….. 84 5.11: Pronóstico del modelo de RNA definitivo para la Serie 2. …….……………. 86 6.1: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en el Análisis de la Serie 1, un solo período. …………………………………...……….. 92 Lista De Figuras 117 6.2: Comparación del pronóstico de RNAs vs. Método de Regresión en el Análisis de la Serie 1, doce períodos. ……………..……………………………………...……….. 95 6.3: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en el Análisis de la Serie 2, doce períodos. ……………………...……………...……….. 7.1: Generador y ejecutor de un Experimento Factorial ……………………...…. 96 100 APÉNDICES A21: Gráficas para comprobación de normalidad e independencia estadística de los residuos en el modelo de regresión de S_Pred. …………………………………... 139 A22: Gráficas para comprobación de normalidad e independencia estadística de los residuos en el modelo de regresión del MAE. ……………..……………………... 139 A23: Gráficas para comprobación de normalidad e independencia estadística de los residuos en el modelo de regresión del MSE. …………………………………..... 140 A24: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza en los residuos del modelo de regresión de la S_Pred. …………………………... 141 A25: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza en los residuos del modelo de regresión del MAE. ……………………………...... 142 A26: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza en los residuos del modelo de regresión del MSE. ….…………………...……….. 143 B21: Gráficas de Residuos para el MSE_T, Serie 1. ………..…………...……….. 151 B22: Gráficas de Residuos para el MSE_V, Serie 1. ………..…………...……….. 151 Lista De Figuras 118 B23: Gráficas de residuos contra variables, Serie 1. ...……..…………...………... 152 B24: Resultados del análisis formal de normalidad en los residuos, Serie 1. ….… 153 B51: Gráficas de Residuos para el MSE_T, Serie 2. ……..……………..………... 157 B52: Gráficas de Residuos para el MSE_V, Serie 2. ……..……………..………... 157 B53: Gráficas de residuos contra variables, Serie 2. ……..……………..………... 158 B54: Resultados del análisis formal de normalidad en los residuos, Serie 2. 159 ….. LISTA DE TABLAS 4.1: Resultados del experimento. …………………………………………………... 46 4.2: Resultados del análisis de varianza para cada medida de desempeño. …..…… 49 4.3: Mejores soluciones encontradas. …………………………………………….... 54 5.1: Resultados del experimento de la Serie 1. ………………………………....….. 66 5.2: Resultados del análisis de varianza en las medidas de desempeño, Serie 1. ….. 68 5.3: Resultados del análisis de varianza en las medidas de desempeño, Serie 1 (Experimento enfocado). .…………………………………………..…………….... 70 5.4a: Soluciones finales al minimizar el MSE_T, Serie 1. .………………………... 75 5.4b: Soluciones finales al minimizar el MSE_V, Serie 1. .………………………... 75 5.5: Resultados del experimento, Serie 2. .………………………….……………... 78 5.6: Resultados del análisis de varianza en las medidas de desempeño, Serie 2. ….. 79 5.7: Resultados del experimento enfocado, Serie 2. ……………………………….. 81 5.8: Resultados del análisis de varianza en las medidas de desempeño, Serie 2 ……………………………………………………....….. 82 5.9: Soluciones eficientes para el análisis de la Serie 2. ……………………....…... 85 (Experimento enfocado) 119 Lista De Tablas 120 6.1: Resultados del análisis de la Serie 1 par el pronóstico de un solo período. ……....….. 90 6.2: Modelo de RNA vs. Suavizado Exponencial Doble en el pronóstico de un solo período, Serie 1. ……………………………………...………………………....….. 91 6.3: Resultados del análisis de la Serie 1 para el pronóstico de 12 períodos. .....….. 93 6.4: Resultados del análisis de la Serie 2, para el pronóstico de 12 períodos. ....….. 93 6.5: Modelo de RNA vs Método Tradicional vs Modelo Real en el análisis de la Serie 1. ...............................................................................................................................….. 94 6.6: Comparación de Resultados, Modelo de RNA vs Método Tradicional vs Modelo Real, Serie 2. ....…………………………………………………………………….. 96 APÉNDICES A11 a A18: Pronóstico de la demanda mensual bajo diferentes combinaciones de parámetros en el modelo de RNAs. ....……………………...………………... 122-137 A31: Resultados de la optimización del MAE. ....………………………………... 146 A32: Resultados de la optimización del MSE. .....………………………………... 146 A33: Resultados de la optimización de la B_Pred. ………………………..……... 146 A34: Resultados de la optimización de la S_Pred. …………………….....………. 147 B11: Pronóstico de los modelos de RNAs experimentales, Serie 1. ……....……... 148 B31: Pronóstico de los modelos de RNAs experimentales, Serie 2. ……....……... 154 B41: Pronóstico de los modelos de RNAs experimentales, experimento enfocado Serie 2. …………………………………………………………………………………... 155 APÉNDICE A1 Este apartado contiene las aproximaciones puntuales de la demanda obtenidas mediante los diferentes modelos de RNAs resultantes de las combinaciones factoriales del experimento. Desde la Tabla A11 hasta la Tabla A18, la primer columna contiene el número de período o mes; la segunda contiene el valor de la demanda registrada en el período correspondiente; las siguientes columnas contienen el valor de la aproximación realizada por el modelo de RNA, la cabecera de estas columnas contiene la combinación factorial de los parámetros del modelo que dan como resultado tales aproximaciones. Por ejemplo, en la Tabla A1, la columna 3 contiene [2,2,1,1,1], esta notación indica que el parámetro neuronas =2; lags = 2; escala = 1; transformación = 1 y algoritmo= 1. Es decir, el modelo de RNA correspondiente a estos valores de parámetros contiene 2 neuronas en la capa oculta, utiliza 2 datos históricos para realizar el pronóstico, maneja los datos en escala observada y no aplica ninguna transformación; el algoritmo de entrenamiento es el ‘lm’ (Levenberg- Marquart). Entonces, las combinaciones de los parámetros son las cabeceras que se encuentran a partir de la tercera columna de cada tabla y representan los valores de los parámetros en el orden: [neuronas, lags, escala, transformación, algoritmo]. 121 Apéndice A1 122 Tabla A11: Pronóstico de la demanda mensual del Mes 1 al 53. Mes Demanda 112 1 99 2 117 3 127 4 132 5 140 6 161 7 167 8 172 9 181 10 181 11 185 12 186 13 208 14 224 15 229 16 249 17 257 18 253 19 283 20 282 21 298 22 305 23 383 24 388 25 390 26 434 27 421 28 441 29 466 30 478 31 500 32 493 33 509 34 499 35 495 36 496 37 491 38 520 39 526 40 530 41 535 42 547 43 553 44 560 45 583 46 602 47 622 48 613 49 638 50 643 51 646 52 646 53 [2,2,1,1,1] [5,2,1,1,1] 108.74 124.12 135.79 141.74 149.85 170.43 178.59 183.96 192.90 194.00 197.69 199.10 219.41 236.66 243.14 261.82 271.41 268.77 295.13 297.79 311.87 319.93 388.64 401.80 404.08 441.56 435.55 450.89 473.92 486.58 505.93 502.60 514.90 508.48 504.13 504.51 500.53 523.61 531.58 535.45 539.90 550.06 556.13 562.34 581.29 598.60 616.13 611.21 629.61 636.00 638.81 117.70 131.56 141.50 146.55 153.65 171.81 178.65 183.33 191.24 192.03 195.34 196.53 214.82 229.98 235.51 252.43 260.77 258.18 282.49 298.00 305.00 333.60 388.00 408.69 410.75 446.59 439.86 454.92 476.83 488.64 507.37 503.62 515.88 509.22 505.15 505.61 501.67 524.54 531.83 535.54 539.89 549.92 555.74 561.84 580.79 597.87 615.37 609.91 628.99 635.06 637.86 [7,2,1,1,1] [2,3,1,1,1] 118.74 118.09 132.09 142.37 150.64 164.73 179.43 184.78 193.88 195.49 198.51 199.84 213.88 237.99 244.08 256.88 272.47 278.28 289.90 298.53 313.17 320.91 384.77 402.50 404.67 436.33 445.78 451.88 474.97 487.15 506.73 502.49 515.45 508.26 504.11 504.65 500.50 524.53 531.74 535.53 539.99 550.32 556.17 562.38 581.73 598.83 616.30 610.54 629.87 635.64 638.37 123.42 136.50 141.77 149.47 170.05 178.64 183.04 191.87 193.07 196.25 197.84 218.12 236.44 242.39 260.64 270.94 267.44 293.68 297.87 310.50 319.46 389.28 405.52 403.76 442.04 437.50 450.34 475.42 488.27 507.19 503.99 515.12 509.55 503.88 504.65 500.83 524.14 533.60 536.26 540.63 550.93 557.28 563.18 582.30 600.21 617.34 612.19 629.31 636.99 638.76 [5,3,1,1,1] [7,3,1,1,1] [2,6,1,1,1] [5,6,1,1,1] [7,6,1,1,1] 120.62 133.90 138.88 146.82 168.43 176.40 180.60 189.69 198.98 202.30 203.77 216.66 234.83 248.62 258.88 268.58 272.87 291.96 303.34 307.79 324.87 388.40 401.26 407.11 438.16 439.79 444.89 470.08 490.64 501.05 505.11 516.91 510.37 504.81 505.88 501.87 517.91 535.02 537.31 541.66 552.21 558.28 564.12 575.37 601.78 618.96 612.42 630.97 638.12 639.62 120.60 134.54 140.66 148.48 168.52 178.59 183.48 192.19 194.19 197.23 199.07 217.89 236.73 243.88 261.14 272.37 270.13 293.63 300.06 311.67 321.15 384.56 405.84 405.47 439.83 439.50 450.28 474.18 487.89 506.00 505.05 514.63 510.88 505.17 505.43 502.06 522.49 533.25 536.38 540.67 550.34 557.03 562.92 580.73 598.77 615.96 613.01 628.04 636.87 639.09 155.53 168.95 182.24 188.17 190.18 193.38 198.17 197.99 215.94 235.89 247.14 257.62 266.43 269.71 286.54 295.21 314.32 315.02 380.44 412.51 419.83 426.89 435.54 459.34 468.48 494.51 514.55 508.13 517.82 511.55 511.18 506.58 506.31 528.41 540.46 548.60 543.69 552.12 562.97 569.63 584.10 603.03 622.07 617.57 626.92 633.76 643.78 148.28 161.56 177.62 183.71 189.00 194.79 200.04 202.28 216.89 237.16 247.24 257.88 270.44 275.33 290.09 303.91 316.48 323.76 371.29 409.90 411.88 426.90 443.40 459.57 475.16 495.94 514.24 515.00 522.38 524.87 497.88 497.33 496.61 511.21 548.50 552.65 552.35 535.22 571.07 576.85 589.33 606.95 623.57 624.63 631.90 644.25 626.74 150.50 178.54 173.83 184.06 184.12 199.37 189.96 204.13 225.71 244.67 242.43 256.77 274.69 262.13 284.07 297.51 311.74 323.71 381.99 418.01 426.23 429.09 429.08 457.65 473.50 496.20 509.63 510.24 507.68 507.82 510.74 504.39 500.06 531.59 538.23 537.33 547.80 552.04 563.29 572.29 588.71 606.52 613.81 622.33 635.99 633.34 648.76 Apéndice A1 123 Continuación Tabla A11: Pronóstico de Demanda del Mes 54 al 71. Mes Demanda 54 709 639.11 638.11 638.59 638.93 639.63 639.51 639.44 651.40 644.08 55 678 686.74 687.85 680.81 685.88 681.82 682.70 673.51 677.63 685.21 56 689 669.77 668.71 678.47 671.32 671.74 673.94 675.38 688.54 673.66 57 58 680 627 674.95 669.28 674.78 668.60 674.60 668.37 672.44 668.66 673.89 669.52 673.20 670.28 677.13 656.10 682.97 651.12 679.07 655.26 59 646 628.00 625.92 636.19 626.81 624.76 631.48 634.26 632.19 621.71 60 645 637.18 636.51 637.23 634.56 635.54 634.41 632.10 627.10 635.44 61 664 638.35 637.32 637.80 638.94 639.75 639.37 633.48 631.56 618.12 62 671 652.74 652.27 652.72 652.30 654.03 651.68 661.69 646.64 665.48 63 671 659.97 659.40 659.57 660.16 661.67 660.31 663.10 674.92 670.37 64 545 660.67 659.99 660.06 660.20 661.26 661.04 661.49 646.95 666.57 65 545 562.89 559.89 553.30 561.79 556.18 555.71 581.68 534.65 562.99 66 545 549.52 549.17 549.41 543.54 542.92 545.81 537.74 544.94 535.20 67 424 549.52 549.17 549.41 549.99 550.63 550.43 459.39 492.07 493.06 68 454.6 450.46 451.85 441.35 448.75 444.79 443.89 419.45 452.45 451.63 69 457.8 462.57 466.17 463.86 456.47 458.81 457.07 465.48 469.68 460.61 70 465.2 468.62 471.38 468.99 470.36 472.68 470.82 452.57 409.67 416.62 471.5 475.11 477.62 475.58 475.49 477.63 475.95 506.54 489.21 482.24 Pronóstico 481.13 483.34 481.54 481.77 483.78 482.19 498.69 509.03 493.12 71 [2,2,1,1,1] [5,2,1,1,1] [7,2,1,1,1] [2,3,1,1,1] [5,3,1,1,1] [7,3,1,1,1] [2,6,1,1,1] [5,6,1,1,1] [7,6,1,1,1] Apéndice A1 124 Tabla A12: Pronóstico de la demanda mensual del Mes 1 al 53. Mes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 Demanda [2,2,1,1,2] [5,2,1,1,2] [7,2,1,1,2] [2,3,1,1,2] [5,3,1,1,2] [7,3,1,1,2] [2,6,1,1,2] [5,6,1,1,2] [7,6,1,1,2] 112 99 117 127 132 140 161 167 172 181 181 185 186 208 224 229 249 257 253 283 282 298 305 383 388 390 434 421 441 466 478 500 493 509 499 495 496 491 520 526 530 535 547 553 560 583 602 622 613 638 643 646 646 117.22 125.60 136.37 142.15 148.87 165.81 175.77 181.12 189.30 191.78 194.86 196.74 214.28 233.50 242.26 260.17 272.74 271.82 295.45 303.54 316.38 326.77 389.24 412.77 415.37 444.33 446.08 455.20 473.14 483.94 496.47 496.88 502.87 501.01 497.62 497.42 495.31 511.19 513.98 516.43 519.32 549.78 553.55 591.43 623.78 631.44 638.16 637.72 642.67 645.61 646.57 112.11 123.81 138.11 145.23 152.79 169.31 178.90 183.51 189.85 192.71 194.76 196.61 207.45 224.03 235.28 248.94 269.25 273.88 288.65 317.25 326.04 344.63 383.27 411.87 413.71 432.09 442.02 449.12 474.34 489.47 501.55 502.28 507.28 505.34 502.81 502.61 501.03 512.31 518.02 521.04 525.13 537.61 546.08 556.95 597.18 625.36 642.06 636.67 648.46 649.82 650.43 116.83 127.39 137.03 142.71 148.36 161.09 174.27 179.93 186.94 192.66 194.45 197.54 208.23 231.17 244.90 258.55 275.79 278.24 292.85 307.64 317.01 327.80 384.05 405.36 407.53 442.58 436.79 451.78 474.32 486.52 506.04 501.87 514.85 507.64 503.48 504.02 499.87 524.00 531.34 535.18 539.72 550.24 556.19 562.53 582.27 599.61 617.20 611.33 630.73 636.37 639.05 125.99 135.97 142.03 148.79 165.30 175.20 181.05 189.19 191.77 195.05 196.89 214.12 232.92 242.24 260.31 272.79 272.58 295.98 303.76 317.34 327.45 388.75 411.73 416.43 444.21 445.93 455.63 472.23 482.76 494.90 495.50 501.42 499.57 496.73 496.37 494.35 511.68 511.43 514.15 516.95 550.83 550.47 593.66 625.58 632.51 638.69 638.47 642.99 645.49 646.52 128.97 129.18 141.00 152.52 170.61 168.29 183.15 191.22 191.56 196.39 197.95 211.30 229.99 240.82 255.81 273.40 276.87 287.83 309.16 321.09 340.68 380.47 389.07 438.34 450.24 456.23 461.59 474.64 482.87 494.82 493.03 501.85 497.09 493.54 493.86 491.48 510.69 519.48 523.70 529.47 544.65 553.57 563.50 595.70 619.01 636.26 629.99 645.18 647.93 649.02 130.20 138.02 144.32 149.53 158.66 169.08 179.14 185.90 191.25 196.00 197.98 207.72 223.61 242.30 259.94 274.03 283.20 298.37 307.26 323.20 331.10 383.07 403.62 407.40 440.58 436.16 448.89 473.11 485.87 505.75 501.46 513.74 507.09 501.17 502.22 498.08 523.84 533.39 535.90 540.60 551.97 558.60 564.88 585.82 604.33 621.33 615.13 632.62 639.38 640.69 161.99 167.34 170.60 180.27 180.08 187.51 200.00 200.95 204.61 229.81 238.47 259.75 260.82 262.47 292.18 312.11 317.67 366.90 377.50 390.13 434.94 420.45 432.38 463.79 462.52 487.10 517.75 506.56 519.45 502.64 505.15 495.02 491.73 520.01 532.55 554.93 547.26 552.53 565.25 576.28 592.80 612.75 635.53 632.52 640.95 639.53 651.20 161.28 166.50 172.24 180.46 180.68 185.76 186.36 207.06 224.77 239.75 242.43 253.01 255.06 273.79 283.37 301.06 310.92 381.44 386.61 389.92 434.14 420.98 440.80 475.12 479.95 483.69 495.30 494.39 501.34 505.80 501.89 506.84 503.49 522.66 535.30 534.52 540.42 551.02 569.39 577.84 600.08 620.42 634.30 634.11 641.29 648.01 649.20 157.83 165.38 167.47 186.77 178.53 198.94 211.41 210.27 225.47 241.40 250.34 259.93 255.84 268.55 288.22 288.97 312.54 312.73 385.17 391.76 428.97 422.33 426.77 465.87 475.03 496.46 527.05 514.20 524.29 511.98 508.99 504.83 499.68 530.61 542.86 554.76 551.14 555.24 566.57 574.44 590.61 608.44 628.37 623.01 631.83 633.83 642.23 Apéndice A1 125 Continuación Tabla A12: Pronóstico de Demanda del Mes 54 al 71. Mes 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 Demanda 709 678 689 680 627 646 645 664 671 671 545 545 545 424 454.6 457.8 465.2 471.5 Pronóstico [2,2,1,1,2] [5,2,1,1,2] [7,2,1,1,2] [2,3,1,1,2] [5,3,1,1,2] [7,3,1,1,2] [2,6,1,1,2] [5,6,1,1,2] [7,6,1,1,2] 646.79 650.45 639.25 646.74 649.04 640.71 647.54 650.55 640.04 657.64 654.07 686.51 656.14 659.74 681.32 667.35 656.04 669.46 656.39 653.50 667.82 655.07 655.69 667.99 666.86 656.37 666.76 656.36 653.79 673.99 655.40 658.21 669.25 675.03 655.61 673.55 655.57 653.55 668.03 654.55 657.33 666.03 656.35 627.03 652.90 639.17 645.47 626.57 638.35 640.47 627.20 638.32 650.39 620.99 645.41 650.35 637.98 645.83 648.29 636.74 637.27 652.81 627.81 646.59 650.27 638.47 646.45 648.77 640.86 623.89 653.60 621.45 650.15 652.64 653.11 649.68 654.19 653.20 657.75 654.89 652.47 652.60 653.13 659.67 651.79 655.81 659.67 661.24 655.71 660.29 653.03 653.14 660.13 652.29 655.82 659.34 662.20 654.41 656.83 538.98 540.93 558.48 536.28 541.81 557.25 545.03 544.99 570.43 526.11 535.78 549.30 544.79 537.94 541.70 534.68 545.00 524.79 526.11 535.78 549.30 523.66 542.52 550.37 478.16 424.01 500.97 470.73 454.60 447.76 472.65 455.10 443.72 454.66 454.57 442.71 463.59 459.58 463.25 466.02 456.14 454.82 456.57 457.80 454.73 471.38 474.61 468.71 470.64 474.43 467.66 421.51 465.17 419.76 475.91 480.18 475.13 475.54 476.85 472.86 478.54 470.25 488.25 480.53 486.03 481.01 479.92 480.09 479.10 492.31 497.60 507.85 Apéndice A1 126 Tabla A13: Pronóstico de Demanda del Mes 1 al 50. Mes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 Demanda [2,2,1,2,1] [5,2,1,2,1] [7,2,1,2,1] [2,3,1,2,1] [5,3,1,2,1] [7,3,1,2,1] [2,6,1,2,1] [5,6,1,2,1] [7,6,1,2,1] 112.00 99.00 117.00 127.00 132.00 140.00 161.00 167.00 172.00 181.00 181.00 185.00 186.00 208.00 224.00 229.00 249.00 257.00 253.00 283.00 282.00 298.00 305.00 383.00 388.00 390.00 434.00 421.00 441.00 466.00 478.00 500.00 493.00 509.00 499.00 495.00 496.00 491.00 520.00 526.00 530.00 535.00 547.00 553.00 560.00 583.00 602.00 622.00 121.74 131.74 136.74 144.74 165.74 171.74 176.74 185.74 185.74 189.74 190.74 212.74 228.74 233.74 253.74 261.74 257.74 287.74 286.74 302.74 309.74 387.74 392.74 394.74 438.74 425.74 445.74 470.74 482.74 504.74 497.74 513.74 503.74 499.74 500.74 495.74 524.74 530.74 534.74 539.74 551.74 557.74 564.74 587.74 606.74 116.15 139.65 144.65 152.65 173.65 179.65 184.65 193.65 183.56 186.28 198.71 207.15 236.65 241.65 257.00 269.65 282.98 282.15 284.56 297.15 317.65 382.15 390.56 402.65 433.15 423.56 440.15 478.65 490.65 512.65 495.56 508.15 501.60 496.00 491.00 501.68 519.15 528.56 542.65 547.65 559.65 565.65 572.65 595.65 614.65 130.84 139.77 144.77 152.68 167.28 179.77 184.77 193.50 193.58 186.01 217.17 203.45 236.77 241.77 256.94 269.77 284.10 278.45 294.77 293.45 317.77 378.45 400.77 422.03 429.45 433.77 454.84 478.77 490.77 512.77 505.77 524.86 491.85 495.90 491.01 509.19 515.45 538.77 542.71 549.23 552.30 565.77 572.77 602.00 614.77 136.72 141.72 149.72 170.72 176.72 181.72 190.72 190.72 194.72 195.72 189.91 233.72 238.72 258.72 266.72 262.72 264.95 291.72 310.28 314.72 382.68 397.72 419.81 415.92 430.72 470.81 475.72 487.72 509.72 502.72 497.61 508.72 504.74 477.91 500.72 501.92 535.72 539.72 544.72 556.72 562.72 569.72 592.72 611.72 129.42 146.78 149.98 168.72 173.65 181.98 190.98 187.68 194.97 194.60 214.99 226.29 245.16 258.98 263.66 269.16 271.51 290.60 307.92 313.58 387.66 394.65 406.16 424.15 431.24 431.52 468.42 492.98 509.98 499.65 499.52 507.60 486.81 478.99 499.60 512.20 534.60 540.07 544.98 555.02 556.49 569.98 590.96 602.46 136.06 140.03 154.66 170.06 171.79 160.13 195.68 183.92 186.00 195.06 223.53 233.06 243.65 256.97 266.06 283.00 282.01 291.06 286.13 314.06 388.85 397.06 466.88 412.03 430.06 466.00 474.98 492.66 493.05 507.66 497.13 508.06 506.56 497.45 521.40 522.93 535.06 518.13 549.66 558.85 561.69 574.63 601.39 611.06 167.00 175.65 180.65 189.65 189.65 193.65 194.65 216.65 232.65 249.00 257.65 265.65 261.65 291.65 290.65 306.65 313.65 391.65 396.65 422.30 442.65 429.65 449.65 474.65 486.65 508.65 501.65 517.65 507.65 503.65 504.65 520.00 526.00 498.61 562.30 543.65 555.65 561.65 568.65 591.65 610.65 167.00 176.49 176.81 190.49 188.55 194.49 195.49 215.55 233.49 233.81 258.49 271.83 267.83 292.49 296.83 295.53 314.49 390.55 397.49 434.00 443.49 428.56 450.49 475.49 500.00 509.49 507.85 516.55 508.49 496.00 505.49 495.68 526.00 535.49 535.00 544.49 553.00 562.49 574.83 592.49 616.83 166.04 187.22 180.18 195.82 195.82 192.52 205.56 222.81 244.22 237.18 263.82 271.82 265.91 282.00 297.77 306.18 324.56 388.00 408.22 398.18 406.91 439.42 448.52 480.83 486.10 507.52 513.22 511.79 518.56 497.79 491.00 509.64 526.00 508.84 538.18 547.00 556.08 572.56 568.18 597.82 622.22 49 613.00 626.74 634.65 634.77 631.72 631.98 636.66 630.65 636.83 630.18 50 638.00 617.74 615.56 625.77 622.72 629.16 627.66 621.65 617.81 633.22 Apéndice A1 127 Continuación Tabla A13: Pronóstico de Demanda del Mes 51 al 71. Mes 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 Demanda 643.00 646.00 646.00 709.00 678.00 689.00 680.00 627.00 646.00 645.00 664.00 671.00 671.00 545.00 545.00 545.00 424.00 454.60 457.80 465.20 Pronóstico [2,2,1,2,1] [5,2,1,2,1] [7,2,1,2,1] [2,3,1,2,1] [5,3,1,2,1] [7,3,1,2,1] [2,6,1,2,1] [5,6,1,2,1] [7,6,1,2,1] 642.74 637.15 646.56 638.78 628.52 626.10 646.65 645.55 643.00 647.74 645.56 655.77 652.72 651.60 652.06 651.65 652.49 662.56 650.74 658.65 638.13 655.72 658.07 634.13 654.65 643.53 654.18 650.74 709.01 677.15 655.72 662.17 709.00 654.65 655.49 665.56 713.74 708.15 704.45 691.97 697.62 687.02 678.00 678.03 676.55 682.74 680.56 690.77 687.72 688.61 687.06 686.65 687.49 702.95 693.74 696.27 689.90 691.01 679.52 685.80 721.30 683.65 698.36 684.74 627.00 627.00 661.91 688.60 672.78 628.96 689.49 638.88 646.00 637.68 645.22 636.72 642.98 638.56 659.30 621.65 645.64 650.74 653.27 646.90 648.01 638.48 644.93 654.65 655.49 652.71 649.74 647.56 657.77 626.91 653.60 637.78 617.61 644.34 609.60 668.74 663.15 659.45 673.74 671.60 652.13 671.00 670.99 682.64 675.74 683.65 683.77 680.72 679.60 680.06 643.61 670.47 635.27 675.74 673.56 558.30 680.72 687.16 659.13 643.61 665.65 581.12 545.00 555.68 563.22 554.72 551.66 556.56 553.65 545.00 557.91 545.00 552.27 545.90 547.01 537.45 525.52 545.00 539.65 539.45 549.74 424.00 424.02 526.91 527.98 457.69 493.96 424.00 514.33 454.60 434.68 442.22 433.72 434.62 435.56 456.30 418.65 447.37 459.34 461.87 455.50 456.61 446.98 435.12 427.21 451.19 449.27 462.54 460.36 470.57 439.71 466.40 450.58 430.41 457.14 422.40 469.94 477.85 458.78 474.93 475.18 453.33 437.81 459.85 483.84 Apéndice A1 128 Tabla A14: Pronóstico de Demanda del Mes 1 al 50. Mes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Demanda [2,2,1,2,2] [5,2,1,2,2] [7,2,1,2,2] [2,3,1,2,2] [5,3,1,2,2] [7,3,1,2,2] [2,6,1,2,2] [5,6,1,2,2] [7,6,1,2,2] 112.00 99.00 117.00 127.00 117.32 118.05 118.19 132.00 127.36 128.36 128.62 127.17 127.40 130.74 140.00 132.29 133.21 133.42 132.35 132.94 136.38 161.00 140.30 141.19 141.39 140.27 140.73 144.23 167.00 161.38 162.37 162.63 161.22 161.57 164.93 161.02 160.96 160.91 172.00 167.34 168.35 168.60 167.35 167.95 171.38 167.29 167.66 167.94 181.00 172.27 173.09 173.26 172.34 172.93 176.37 172.27 172.60 172.85 181.00 181.31 182.22 182.43 181.23 181.59 184.94 181.17 181.35 181.49 185.00 181.23 181.91 182.04 181.28 181.77 185.30 181.25 181.55 181.78 186.00 185.23 185.69 185.76 185.21 185.53 188.57 185.26 185.59 185.84 208.00 186.21 186.68 186.75 186.16 186.36 188.87 186.15 186.32 186.44 224.00 208.38 209.35 209.61 208.09 208.11 208.28 208.14 208.27 208.37 229.00 224.39 225.37 225.64 224.32 224.89 228.37 224.26 224.59 224.84 249.00 229.32 230.31 230.54 229.36 229.97 233.38 229.27 229.61 229.86 257.00 249.38 250.36 250.62 249.29 249.80 253.31 249.19 249.41 249.57 253.00 257.35 258.35 258.61 257.34 257.92 261.38 257.25 257.56 257.79 283.00 253.17 253.46 253.49 253.35 253.95 257.38 253.29 253.67 253.94 282.00 283.39 284.37 284.63 283.04 282.91 280.92 283.18 283.38 283.52 298.00 282.32 283.35 283.60 282.35 282.95 286.38 282.27 282.63 282.89 305.00 298.34 299.28 299.51 298.34 298.91 302.37 298.29 298.65 298.92 383.00 305.33 306.33 306.58 305.28 305.78 309.33 305.21 305.45 305.64 388.00 383.41 384.37 384.64 383.16 383.39 385.80 383.15 383.29 383.40 390.00 388.40 389.37 389.64 388.37 388.98 392.38 388.30 388.68 388.96 434.00 390.23 390.84 390.95 390.37 390.98 394.38 390.30 390.68 390.96 421.00 434.40 435.37 435.64 434.05 433.94 432.53 434.12 434.22 434.27 441.00 421.27 422.33 422.58 421.37 421.98 425.38 421.30 421.68 421.96 466.00 441.33 442.15 442.32 441.33 441.91 445.35 441.30 441.68 441.96 478.00 466.40 467.37 467.64 466.15 466.34 469.52 466.11 466.21 466.29 500.00 478.38 479.37 479.64 478.37 478.98 482.38 478.29 478.67 478.94 493.00 500.39 501.37 501.64 500.36 500.96 504.38 500.30 500.68 500.96 509.00 493.22 494.07 494.25 493.36 493.97 497.38 493.21 493.45 493.64 499.00 509.32 510.16 510.34 509.23 509.61 512.63 509.27 509.61 509.86 495.00 499.14 499.44 499.48 499.27 499.73 503.31 499.28 499.64 499.91 496.00 495.07 494.34 494.11 495.18 495.41 497.20 495.23 495.52 495.72 491.00 496.17 496.03 495.97 495.92 495.48 492.28 496.15 496.29 496.40 520.00 491.12 490.79 490.68 491.08 491.03 490.80 491.01 490.95 490.91 526.00 520.39 521.36 521.63 519.94 519.57 516.40 520.13 520.26 520.35 530.00 526.36 527.37 527.63 526.34 526.93 530.38 526.16 526.35 526.51 535.00 530.26 531.04 531.19 530.36 530.96 534.38 530.24 530.53 530.74 547.00 535.26 536.01 536.15 535.22 535.58 538.91 535.09 535.14 535.17 553.00 547.33 548.29 548.52 547.19 547.48 550.52 547.12 547.21 547.29 560.00 553.31 554.27 554.50 553.30 553.81 557.34 553.29 553.66 553.94 583.00 560.30 561.18 561.37 560.30 560.81 564.32 560.22 560.50 560.70 602.00 583.39 584.37 584.63 583.21 583.55 586.82 583.16 583.34 583.48 622.00 602.39 603.37 603.64 602.35 602.94 606.38 602.27 602.61 602.86 613.00 622.39 623.37 623.64 622.37 622.97 626.38 622.29 622.66 622.93 638.00 613.18 613.83 613.95 613.37 613.98 617.38 613.28 613.64 613.91 Apéndice A1 129 Continuación Tabla A14: Pronóstico de Demanda del Mes 51 al 71. Mes Demanda [2,2,1,2,2] [5,2,1,2,2] [7,2,1,2,2] [2,3,1,2,2] [5,3,1,2,2] [7,3,1,2,2] [2,6,1,2,2] [5,6,1,2,2] [7,6,1,2,2] 51 643.00 638.37 639.33 639.57 638.15 638.32 639.12 638.17 638.35 638.47 52 646.00 643.35 644.36 644.62 643.30 643.84 647.37 643.29 643.66 643.93 53 646.00 646.25 646.92 647.05 646.35 646.95 650.38 646.29 646.67 646.94 54 709.00 646.20 646.50 646.54 646.21 646.55 649.77 646.24 646.53 646.75 55 678.00 709.41 710.37 710.64 708.94 708.55 705.39 708.94 708.75 708.60 56 689.00 678.15 679.28 679.52 678.37 678.98 682.38 678.30 678.68 678.96 57 680.00 689.13 688.33 688.09 689.34 689.91 693.31 689.23 689.48 689.66 58 627.00 680.12 680.14 680.11 679.91 679.45 676.39 679.91 679.67 679.49 59 646.00 626.95 626.15 625.84 627.27 627.72 631.13 627.25 627.56 627.79 60 645.00 646.11 645.18 644.89 645.82 645.24 642.14 646.07 646.06 646.01 61 664.00 645.27 646.23 646.44 644.84 644.28 641.15 644.82 644.44 644.17 62 671.00 664.36 665.33 665.57 664.26 664.71 668.13 664.26 664.58 664.83 63 671.00 671.34 672.35 672.60 671.31 671.85 675.36 670.97 670.85 670.77 64 545.00 671.22 671.79 671.89 671.34 671.93 675.38 670.84 670.49 670.23 65 545.00 544.94 544.15 543.84 545.36 545.97 549.38 545.28 545.65 545.92 66 545.00 544.95 544.15 543.84 544.82 544.24 541.14 544.81 544.42 544.15 67 424.00 545.18 545.25 545.24 544.82 544.24 541.14 544.81 544.43 544.15 68 454.60 423.94 423.15 422.84 424.35 424.94 428.38 424.29 424.66 424.93 69 457.80 454.57 453.75 453.44 454.42 453.84 450.74 454.41 454.02 453.75 70 465.20 458.15 459.16 459.43 457.62 457.04 453.94 457.61 457.22 456.95 71 Pronóstico 465.49 466.31 466.48 465.56 466.16 469.58 465.48 465.85 466.13 Apéndice A1 130 Tabla A15: Pronóstico de Demanda del Mes 1 al 50. Mes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Demanda [2,2,2,1,1] [5,2,2,1,1] [7,2,2,1,1] [2,3,2,1,1] [5,3,2,1,1] [7,3,2,1,1] [2,6,2,1,1] [5,6,2,1,1] [7,6,2,1,1] 112.00 99.00 117.00 113.21 119.09 112.88 127.00 123.00 123.00 123.39 122.12 126.70 128.42 132.00 134.36 134.55 135.18 133.36 138.00 138.70 140.00 140.39 141.03 141.36 139.61 143.82 141.21 161.00 147.58 147.36 148.67 146.91 149.70 146.48 150.45 161.48 155.94 167.00 165.55 162.64 166.70 164.94 164.03 165.45 162.82 174.00 168.12 172.00 175.42 175.27 176.39 174.94 175.18 173.15 176.12 172.21 171.91 181.00 180.88 180.94 181.70 180.67 180.03 176.76 183.09 180.52 176.24 181.00 189.27 188.67 189.88 189.15 187.15 186.82 189.24 175.48 183.85 185.00 191.58 192.67 192.06 191.48 190.61 187.36 190.36 180.12 186.12 186.00 194.79 195.15 195.15 194.82 192.82 191.09 196.33 196.42 196.82 208.00 196.61 197.55 196.91 196.64 195.00 192.85 197.85 198.15 204.12 224.00 214.70 211.73 214.00 214.73 208.70 221.00 214.33 225.42 210.12 229.00 233.58 231.18 231.48 233.55 227.70 230.82 234.76 220.48 231.97 249.00 241.94 240.85 239.27 242.15 237.21 241.33 244.03 236.06 242.91 257.00 259.82 254.79 254.61 260.18 251.94 265.27 259.33 249.73 256.12 253.00 271.76 266.82 265.24 272.06 265.73 247.36 267.33 254.88 252.12 283.00 270.55 267.36 264.82 271.15 266.21 278.30 269.30 285.39 278.52 282.00 294.27 282.73 280.18 294.82 284.12 280.09 290.39 279.79 281.61 298.00 301.33 296.15 296.06 301.70 296.06 298.12 296.52 307.36 293.82 305.00 314.12 299.36 303.03 314.79 306.39 302.85 312.15 302.79 304.55 383.00 323.91 367.09 380.12 324.42 380.52 379.85 321.15 377.06 381.45 388.00 386.06 385.48 382.76 385.85 385.48 385.48 374.85 385.55 386.09 390.00 407.55 420.55 410.18 406.94 398.64 388.52 406.79 385.79 388.33 434.00 410.03 422.03 412.30 410.36 431.21 431.18 410.03 432.70 431.64 421.00 439.85 445.09 433.15 439.52 428.09 418.24 435.03 420.03 416.39 441.00 440.52 441.48 437.55 440.15 437.52 438.33 430.21 436.00 438.70 466.00 450.42 451.52 445.42 450.30 463.00 459.67 454.33 459.18 462.70 478.00 469.03 468.18 466.85 468.21 464.91 473.91 472.70 474.82 475.70 500.00 480.15 477.70 480.91 479.18 479.76 484.33 484.82 496.45 494.12 493.00 493.67 494.55 498.85 492.48 494.55 498.18 510.64 499.09 489.18 509.00 493.67 490.27 498.91 492.58 498.06 495.45 505.94 505.91 506.61 499.00 500.52 502.55 508.39 499.36 503.45 502.33 514.18 496.52 500.03 495.00 498.12 495.30 505.00 496.97 503.61 499.00 512.67 491.79 489.00 496.00 494.52 491.73 500.06 493.67 498.30 494.27 507.79 489.39 491.55 491.00 494.39 492.30 499.85 493.45 497.64 494.88 509.88 490.76 488.12 520.00 492.03 488.58 496.64 491.12 495.58 492.12 504.61 524.55 515.70 526.00 508.33 511.85 515.76 509.03 510.45 509.48 525.97 521.88 522.97 530.00 512.55 518.67 527.00 510.85 527.91 523.00 536.52 525.00 524.30 535.00 515.21 522.67 532.91 513.67 535.24 520.45 541.52 536.24 530.00 547.00 518.15 527.64 543.42 516.58 541.76 524.24 544.06 531.06 545.82 553.00 547.09 539.97 549.42 548.88 549.85 535.61 548.27 548.94 549.30 560.00 550.70 546.94 555.12 548.27 555.76 545.06 559.00 557.88 564.70 583.00 588.42 555.00 582.42 590.42 579.39 550.76 565.42 572.88 576.27 602.00 614.64 583.39 604.45 615.48 605.58 580.45 580.42 602.33 594.09 622.00 623.73 611.12 620.88 624.21 617.73 617.09 596.97 611.88 619.94 613.00 631.94 609.03 607.79 632.18 628.12 641.03 614.97 613.18 609.58 638.00 631.15 630.36 635.33 631.48 629.30 633.00 613.79 635.00 633.24 Apéndice A1 131 Continuación Tabla A15 Pronóstico de Demanda del Mes 51 al 71. Mes 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 Demanda 643.00 646.00 646.00 709.00 678.00 689.00 680.00 627.00 646.00 645.00 664.00 671.00 671.00 545.00 545.00 545.00 424.00 454.60 457.80 465.20 471.50 Pronóstico [2,2,2,1,1] [5,2,2,1,1] [7,2,2,1,1] [2,3,2,1,1] [5,3,2,1,1] [7,3,2,1,1] [2,6,2,1,1] [5,6,2,1,1] [7,6,2,1,1] 637.61 618.73 640.45 637.76 634.88 646.91 623.45 618.88 638.70 641.15 641.82 649.91 641.09 641.09 641.88 631.94 619.67 641.67 642.39 641.82 653.58 642.36 642.67 660.85 637.09 643.61 640.27 642.64 690.64 658.03 642.64 643.15 660.45 639.82 678.21 704.45 657.33 688.91 681.64 656.61 658.82 673.64 670.15 679.79 673.58 655.03 665.94 688.64 654.39 661.21 684.55 671.33 679.06 684.55 655.27 636.70 676.21 654.88 658.70 678.36 672.27 673.67 675.73 654.09 614.88 622.64 653.61 658.52 622.94 664.48 616.94 622.91 635.94 657.48 654.52 635.30 643.76 640.64 629.06 617.94 642.09 641.03 635.03 640.03 641.27 639.39 637.73 637.67 655.42 640.88 642.36 688.67 658.18 642.30 643.00 659.42 635.15 648.12 659.67 647.12 673.97 657.15 646.91 647.73 666.18 652.97 677.94 666.64 650.24 666.67 666.73 649.85 652.67 666.67 664.15 674.15 666.67 650.76 591.76 541.58 650.42 653.67 541.48 657.18 619.33 542.06 539.79 544.00 541.45 538.18 541.39 540.27 541.48 541.42 541.48 525.09 538.36 481.48 541.36 541.55 541.42 541.48 538.67 541.45 525.09 538.36 481.48 523.48 421.36 532.67 421.27 422.42 421.27 463.94 449.48 451.67 464.45 451.67 453.48 451.67 451.52 451.67 459.24 459.85 455.06 460.00 460.36 455.03 454.85 454.18 454.79 466.82 463.79 464.55 466.09 465.30 469.73 462.18 461.91 462.18 471.61 468.67 470.27 471.06 469.97 475.79 486.45 468.03 469.12 476.45 473.2158 476.27 475.7539 513.59 479.5061 504.98 351.7888 695.82 Apéndice A1 132 Tabla A16: Pronóstico de Demanda del Mes 1 al 50. Mes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Demanda [2,2,2,1,2] [5,2,2,1,2] [7,2,2,1,2] [2,3,2,1,2] [5,3,2,1,2] [7,3,2,1,2] [2,6,2,1,2] [5,6,2,1,2] [7,6,2,1,2] 112.00 99.00 117.00 119.79 117.30 116.58 127.00 132.24 130.15 129.27 132.45 129.58 128.79 132.00 141.70 140.27 139.67 143.24 141.03 140.30 140.00 146.58 145.52 145.03 147.70 145.91 145.36 161.00 153.39 152.61 152.18 154.09 152.73 152.27 160.52 157.39 156.94 167.00 171.03 170.82 170.45 171.39 170.82 170.48 172.06 170.03 169.73 172.00 178.03 178.33 178.24 179.12 179.00 178.82 182.18 180.94 180.73 181.00 182.73 183.21 183.21 183.03 183.21 183.21 189.55 188.88 188.73 181.00 190.70 191.33 191.36 190.76 191.21 191.27 192.12 191.55 191.42 185.00 191.61 192.45 192.58 192.00 192.58 192.70 192.64 191.85 191.79 186.00 194.94 195.79 195.94 194.76 195.48 195.67 197.42 196.79 196.76 208.00 196.18 197.12 197.30 196.24 197.00 197.21 196.76 195.94 195.91 224.00 214.82 215.85 215.91 214.27 215.33 215.48 213.42 213.58 213.61 229.00 230.85 232.18 232.45 231.36 232.67 232.85 230.88 231.97 232.06 249.00 236.88 238.45 238.91 237.15 238.76 239.15 242.94 244.64 244.79 257.00 254.82 256.30 256.64 254.24 255.94 256.33 256.73 258.82 259.03 253.00 264.03 265.73 266.24 264.39 266.18 266.61 262.36 264.61 264.85 283.00 261.39 263.27 263.94 261.18 263.27 263.94 265.06 267.21 267.48 282.00 287.52 288.79 289.09 286.21 287.94 288.36 284.52 286.73 287.03 298.00 289.94 291.70 292.39 290.91 292.73 293.24 287.00 289.30 289.61 305.00 304.12 305.52 306.00 303.15 304.97 305.55 309.48 311.67 311.94 383.00 312.18 313.64 314.24 312.30 314.00 314.52 310.70 313.06 313.39 388.00 383.36 382.55 382.27 382.73 382.21 381.88 379.12 379.82 379.82 390.00 396.58 396.73 397.15 400.85 400.33 400.21 405.55 406.03 406.00 434.00 398.91 399.09 399.55 398.70 399.15 399.55 423.15 423.30 423.24 421.00 438.42 437.21 437.09 438.06 437.03 436.88 435.91 435.97 435.97 441.00 431.73 431.58 431.94 434.15 433.67 433.79 428.58 429.00 429.15 466.00 448.00 447.03 447.06 446.85 446.24 446.30 459.61 458.67 458.61 478.00 472.03 470.64 470.52 473.06 471.52 471.27 468.00 467.18 467.15 500.00 485.06 483.73 483.64 486.48 484.91 484.67 489.70 488.12 487.97 493.00 505.06 503.42 503.15 505.76 503.94 503.64 515.79 513.70 513.42 509.00 501.45 500.27 500.18 502.73 501.33 501.12 506.88 505.36 505.24 499.00 514.18 512.58 512.33 513.76 512.18 511.94 518.18 516.30 516.15 495.00 507.45 506.30 506.18 508.39 507.06 506.85 506.39 505.15 505.12 496.00 503.06 501.82 501.70 502.36 501.27 501.15 505.30 503.91 503.88 491.00 503.48 502.15 502.03 503.15 501.91 501.76 500.03 498.97 498.94 520.00 499.33 498.15 498.06 499.33 498.15 498.03 496.30 495.21 495.21 526.00 523.15 521.30 520.97 522.88 521.03 520.67 522.85 520.94 520.79 530.00 531.06 529.58 529.30 532.85 530.97 530.61 533.39 531.48 531.27 535.00 534.94 533.52 533.21 535.33 533.76 533.42 545.82 543.64 543.39 547.00 539.42 538.00 537.70 539.70 538.12 537.79 543.00 541.15 541.00 553.00 549.64 548.12 547.79 550.00 548.33 547.97 549.00 547.03 546.88 560.00 555.61 554.27 553.91 556.36 554.79 554.42 558.55 556.64 556.42 583.00 561.76 560.45 560.09 562.15 560.67 560.30 566.52 564.58 564.36 602.00 580.36 579.09 578.73 580.88 579.39 579.03 582.73 580.85 580.61 622.00 596.91 596.12 595.82 598.30 597.15 596.88 600.88 599.27 599.03 613.00 613.36 613.09 612.88 614.45 613.91 613.76 622.06 621.06 620.82 638.00 608.61 608.58 608.33 609.61 609.30 609.09 617.21 616.36 616.18 Apéndice A1 133 Continuación Tabla A16 pronóstico de Demanda del Mes 51 al 71 Mes Demanda [2,2,2,1,2] [5,2,2,1,2] [7,2,2,1,2] [2,3,2,1,2] [5,3,2,1,2] [7,3,2,1,2] [2,6,2,1,2] [5,6,2,1,2] [7,6,2,1,2] 51 643.00 625.82 625.97 625.88 625.30 625.42 625.36 628.76 628.27 628.15 52 646.00 631.52 632.21 632.12 632.70 633.15 633.18 630.09 630.09 630.03 53 646.00 634.03 634.88 634.82 634.09 634.85 634.88 640.03 640.39 640.39 54 709.00 634.27 635.18 635.15 634.21 635.06 635.06 636.73 637.27 637.33 55 678.00 675.97 678.76 679.70 675.79 678.82 679.85 672.39 675.03 675.27 56 689.00 661.12 664.00 664.24 663.64 666.30 666.88 666.88 669.61 669.88 57 680.00 665.76 668.42 668.91 663.70 666.67 667.09 678.00 681.30 681.67 58 627.00 660.82 663.36 663.70 660.82 663.42 663.88 652.52 654.73 655.00 59 646.00 623.88 625.06 624.79 622.79 624.00 623.76 620.24 621.00 621.09 60 645.00 632.64 633.21 633.18 629.61 630.52 630.39 623.79 624.94 625.09 61 664.00 633.58 634.48 634.42 634.39 635.09 635.12 616.30 617.33 617.42 62 671.00 646.55 647.85 648.00 646.27 647.61 647.82 650.27 651.82 652.06 63 671.00 652.82 654.67 654.88 653.48 655.27 655.61 657.52 659.64 659.91 64 545.00 653.39 655.36 655.58 653.36 655.33 655.67 657.24 658.97 659.15 65 545.00 561.45 562.15 561.94 560.79 561.58 561.27 566.03 566.55 566.52 66 545.00 549.00 547.70 547.39 541.33 541.33 541.15 528.61 528.97 528.94 67 424.00 549.00 547.70 547.39 549.03 547.64 547.30 500.36 501.94 501.88 68 454.60 446.58 447.91 448.94 446.48 448.12 449.06 448.21 449.36 449.45 69 457.80 460.27 458.94 458.85 452.39 452.79 453.24 454.85 454.97 455.03 70 465.20 466.36 465.39 465.45 468.06 466.85 466.73 425.15 426.03 426.27 71 471.50 473.15 472.03 472.00 473.15 472.09 472.06 482.67 480.94 480.79 Pronóstico 479.3897 478.20 478.1676 479.69 478.5033 478.40 493.3815 491.96 491.8227 Apéndice A1 134 Tabla A17: Pronóstico de demanda del Mes 1 al 50. Mes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Demanda [2,2,2,2,1] [5,2,2,2,1] [7,2,2,2,1] [2,3,2,2,1] [5,3,2,2,1] [7,3,2,2,1] [2,6,2,2,1] [5,6,2,2,1] [7,6,2,2,1] 112.00 99.00 117.00 127.00 123.30 124.74 127.82 132.00 133.38 135.00 139.31 127.10 129.82 131.42 140.00 138.38 140.01 137.91 141.45 139.12 139.54 161.00 146.40 147.93 151.78 149.28 152.98 147.53 167.00 167.37 168.81 167.28 169.38 166.95 168.54 173.60 168.82 167.18 172.00 173.37 175.10 179.31 176.26 178.78 174.65 179.53 174.35 174.44 181.00 178.38 179.98 184.38 181.46 185.07 178.80 184.62 181.49 179.80 181.00 187.40 188.91 190.81 190.05 191.53 188.54 193.58 184.79 182.89 185.00 187.36 189.09 183.92 190.21 194.49 187.44 193.59 188.67 183.67 186.00 191.39 193.01 186.59 194.29 199.53 191.70 197.56 195.77 186.96 208.00 192.37 194.04 199.93 194.79 196.79 196.11 198.60 209.34 207.52 224.00 214.28 215.77 209.09 216.01 213.60 224.05 220.62 215.54 225.56 229.00 230.40 231.94 236.31 232.10 229.38 231.54 236.60 231.53 229.94 249.00 235.37 237.07 241.31 238.47 237.21 239.47 241.63 236.85 251.19 257.00 255.38 256.80 250.79 258.32 260.10 256.54 261.62 258.18 258.97 253.00 263.37 265.05 269.31 266.05 266.60 264.55 269.59 251.83 257.68 283.00 259.35 281.92 278.39 262.47 266.79 282.95 265.57 261.96 284.46 282.00 287.36 282.00 284.04 291.14 288.00 289.58 295.56 286.30 281.11 298.00 288.34 290.42 294.31 290.52 290.30 287.78 294.49 294.84 296.19 305.00 304.41 305.81 299.05 307.48 306.95 305.54 310.62 302.55 304.00 383.00 311.37 313.03 317.31 313.38 312.57 383.05 317.23 380.58 380.98 388.00 388.00 371.36 384.10 384.70 381.74 390.54 382.51 391.20 387.88 390.00 394.34 397.42 400.31 397.33 396.51 398.96 391.71 393.20 390.19 434.00 396.37 398.01 418.73 399.49 433.06 432.67 400.13 434.10 434.16 421.00 420.44 422.40 435.10 438.24 435.17 420.08 423.48 421.00 421.05 441.00 427.33 430.42 433.31 430.35 436.36 441.00 432.64 441.00 440.93 466.00 447.15 448.73 465.46 450.49 458.60 448.54 450.10 463.69 465.98 478.00 472.34 473.83 478.31 450.89 466.31 470.42 476.16 478.00 479.01 500.00 484.38 486.03 490.31 487.45 500.00 485.57 490.59 497.98 500.40 493.00 506.37 507.82 494.87 509.45 501.86 507.54 511.55 506.49 492.92 509.00 499.34 501.48 505.31 502.44 513.22 509.05 505.62 509.07 508.77 499.00 515.40 516.79 508.73 518.44 499.00 516.54 521.59 498.79 499.07 495.00 505.34 508.18 514.24 507.52 509.98 494.95 502.38 495.00 493.84 496.00 501.37 511.87 495.44 504.45 518.83 495.94 507.62 509.45 495.84 491.00 502.38 491.04 491.13 501.70 502.86 520.64 507.64 490.37 490.67 520.00 497.36 507.99 520.43 499.56 502.36 519.96 503.62 517.42 519.76 526.00 524.67 525.99 521.01 525.51 523.20 524.42 532.62 524.98 526.18 530.00 532.36 534.19 538.31 533.68 531.79 534.08 538.63 541.34 529.90 535.00 536.38 537.99 532.00 539.48 544.42 535.83 542.54 537.63 534.92 547.00 541.38 542.96 541.39 544.14 547.19 542.36 547.59 546.08 546.70 553.00 553.41 554.88 552.64 555.74 555.52 563.00 559.62 552.36 552.49 560.00 559.38 561.01 565.04 562.08 563.81 560.52 565.20 560.47 561.96 583.00 566.39 567.95 581.99 569.35 574.46 567.51 572.62 571.26 583.35 602.00 589.30 590.79 590.22 591.40 588.78 590.54 595.62 591.85 596.96 622.00 608.40 609.91 614.31 610.86 608.61 609.54 614.62 608.74 620.78 613.00 628.40 629.87 634.31 631.44 624.01 629.54 634.62 626.86 611.51 638.00 619.34 621.52 625.31 622.48 626.82 637.98 625.58 637.31 636.16 Apéndice A1 135 Continuación Tabla A17pronóstico de Demanda del Mes 51 al 71. Mes 51 Demanda 643.00 [2,2,2,2,1] [5,2,2,2,1] [7,2,2,2,1] [2,3,2,2,1] [5,3,2,2,1] [7,3,2,2,1] [2,6,2,2,1] [5,6,2,2,1] [7,6,2,2,1] 643.56 645.72 639.44 647.35 649.90 645.54 650.62 642.89 642.97 52 646.00 649.36 651.17 655.31 649.14 647.88 648.65 648.51 646.00 645.33 53 646.00 652.38 654.00 671.89 655.48 658.22 635.21 658.62 651.47 644.61 54 709.00 652.37 709.21 710.36 655.19 659.88 696.68 658.07 712.08 710.68 55 678.00 678.08 697.36 710.18 693.00 707.73 678.02 719.95 677.71 677.94 56 689.00 684.33 690.60 690.31 687.44 699.85 686.93 685.66 688.21 688.52 57 680.00 695.40 686.34 686.85 698.49 680.00 682.44 690.91 680.06 679.89 58 627.00 686.34 627.00 627.00 636.23 682.35 626.90 624.64 627.01 627.08 59 646.00 633.33 646.35 645.96 636.49 645.83 648.19 639.61 646.00 646.01 60 645.00 647.96 643.28 643.67 640.31 650.24 650.42 646.20 645.03 644.90 61 664.00 651.35 653.24 657.31 663.99 643.12 649.71 657.62 664.06 664.07 62 671.00 670.37 671.79 665.06 673.39 677.35 671.54 671.26 667.44 671.01 63 671.00 677.37 679.06 683.31 679.40 678.43 679.29 683.63 671.14 670.93 64 545.00 677.36 679.07 545.65 680.46 545.07 549.70 545.06 545.02 545.05 65 545.00 551.33 545.00 545.06 554.49 545.00 545.00 546.89 545.00 545.00 66 545.00 544.15 542.24 545.00 552.71 545.00 544.89 543.40 545.00 545.01 67 424.00 551.37 424.00 424.00 424.26 424.00 424.03 424.48 423.99 424.00 68 454.60 430.33 454.46 454.58 454.59 454.80 454.48 436.46 454.50 454.64 69 457.80 457.78 451.83 452.27 451.46 457.80 459.02 456.53 457.76 457.79 70 465.20 464.15 466.10 470.11 464.79 454.16 462.22 465.14 465.14 465.23 71 Pronóstico 471.59 473.12 467.16 474.68 479.05 474.01 548.59 468.32 648.85 Apéndice A1 136 Tabla A18: Pronóstico de demanda del Mes 1 al 50. Mes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Demanda [2,2,2,2,2] [5,2,2,2,2] [7,2,2,2,2] [2,3,2,2,2] [5,3,2,2,2] [7,3,2,2,2] [2,6,2,2,2] [5,6,2,2,2] [7,6,2,2,2] 112.00 99.00 117.00 127.00 121.77 121.77 121.77 132.00 131.77 131.77 131.77 127.67 127.58 127.56 140.00 136.77 136.77 136.77 141.30 141.28 141.28 161.00 144.77 144.77 144.77 146.40 146.33 146.31 167.00 165.77 165.77 165.77 165.09 165.01 165.00 164.44 163.54 163.44 172.00 171.77 171.77 171.77 174.28 174.22 174.21 182.63 173.90 173.72 181.00 176.77 176.77 176.77 181.82 181.81 181.81 187.48 180.47 180.29 181.00 185.77 185.77 185.77 186.17 186.08 186.07 193.36 184.66 184.53 185.00 185.77 185.77 185.77 186.98 186.90 186.89 194.87 185.73 185.58 186.00 189.77 189.77 189.77 191.05 190.97 190.96 200.36 190.79 190.62 208.00 190.77 190.77 190.77 190.06 189.96 189.95 199.86 189.44 189.31 224.00 212.77 212.77 212.77 211.15 211.06 211.05 218.41 211.22 211.10 229.00 228.77 228.77 228.77 228.51 228.44 228.43 238.61 228.86 228.71 249.00 233.77 233.77 233.77 239.88 239.90 239.91 240.88 238.55 238.37 257.00 253.77 253.77 253.77 256.07 256.02 256.01 260.64 254.53 254.39 253.00 261.77 261.77 261.77 263.18 263.11 263.10 269.06 261.33 261.19 283.00 257.77 257.77 257.77 263.45 263.45 263.45 270.91 262.12 261.93 282.00 287.77 287.77 287.77 286.20 286.12 286.10 293.47 285.77 285.64 298.00 286.77 286.77 286.77 287.19 287.11 287.10 294.81 286.22 286.08 305.00 302.77 302.77 302.77 308.85 308.87 308.87 311.95 308.27 308.06 383.00 309.77 309.77 309.77 309.23 309.14 309.13 315.16 308.10 307.98 388.00 387.77 387.77 387.77 385.24 385.20 385.19 366.98 385.26 385.15 390.00 392.77 392.77 392.77 399.57 399.65 399.66 395.23 399.61 399.40 434.00 394.77 394.77 394.77 414.84 415.83 416.01 372.74 410.76 410.55 421.00 438.77 438.77 438.77 435.61 435.54 435.53 427.09 432.49 432.43 441.00 425.77 425.77 425.77 430.02 430.00 430.00 430.99 426.58 426.43 466.00 445.77 445.77 445.77 454.42 454.53 454.55 455.63 455.22 454.96 478.00 470.77 470.77 470.77 465.52 465.45 465.44 465.84 464.48 464.42 500.00 482.77 482.77 482.77 488.45 488.47 488.47 484.98 486.81 486.62 493.00 504.77 504.77 504.77 509.98 509.99 509.99 514.29 510.19 509.98 509.00 497.77 497.77 497.77 502.57 502.56 502.55 504.91 499.04 498.90 499.00 513.77 513.77 513.77 517.14 517.10 517.09 521.66 515.45 515.28 495.00 503.77 503.77 503.77 502.98 502.88 502.86 497.08 502.17 502.03 496.00 499.77 499.77 499.77 502.91 502.85 502.84 509.24 501.79 501.61 491.00 500.77 500.77 500.77 496.52 496.42 496.40 500.59 497.10 496.99 520.00 495.77 495.77 495.77 494.19 494.08 494.06 502.39 493.74 493.63 526.00 524.77 524.77 524.77 521.18 521.10 521.08 533.22 522.96 522.83 530.00 530.77 530.77 530.77 530.22 530.14 530.13 539.86 530.20 530.07 535.00 534.77 534.77 534.77 542.10 542.16 542.17 534.61 540.69 540.51 547.00 539.77 539.77 539.77 540.44 540.35 540.34 548.12 538.69 538.57 553.00 551.77 551.77 551.77 551.35 551.26 551.23 554.62 549.69 549.58 560.00 557.77 557.77 557.77 558.70 558.63 558.61 565.55 559.08 558.91 583.00 564.77 564.77 564.77 567.12 567.06 567.05 574.39 566.32 566.15 602.00 587.77 587.77 587.77 587.13 587.05 587.03 594.06 586.58 586.46 622.00 606.77 606.77 606.77 608.05 607.99 607.98 614.93 607.47 607.33 613.00 626.77 626.77 626.77 632.14 632.15 632.15 636.34 631.23 631.04 638.00 617.77 617.77 617.77 624.52 624.56 624.56 630.48 621.91 621.72 Apéndice A1 137 Continuación Tabla A18 Pronóstico de demanda del Mes 51 al 71 Mes 51 Demanda 643.00 [2,2,2,2,2] [5,2,2,2,2] [7,2,2,2,2] [2,3,2,2,2] [5,3,2,2,2] [7,3,2,2,2] [2,6,2,2,2] [5,6,2,2,2] [7,6,2,2,2] 642.77 642.77 642.77 644.66 644.59 644.58 645.17 642.50 642.36 52 646.00 647.77 647.77 647.77 645.84 645.74 645.73 641.91 645.36 645.23 53 646.00 650.77 650.77 650.77 657.01 657.03 657.04 662.28 656.13 655.93 54 709.00 650.77 650.77 650.77 651.50 651.41 651.39 657.14 650.76 650.60 55 678.00 713.77 713.77 713.77 708.20 708.15 708.14 700.32 708.15 708.09 56 689.00 682.77 682.77 682.77 689.46 689.50 689.51 686.10 689.12 688.91 57 680.00 693.77 693.77 693.77 706.84 707.16 707.23 674.26 704.09 703.88 58 627.00 684.77 684.77 684.77 676.49 676.42 676.41 653.81 674.41 674.41 59 646.00 631.77 631.77 631.77 637.70 637.66 637.66 642.29 634.86 634.68 60 645.00 650.77 650.77 650.77 641.16 641.09 641.08 630.99 644.97 644.85 61 664.00 649.77 649.77 649.77 634.94 634.98 634.98 650.64 636.68 636.72 62 671.00 668.77 668.77 668.77 671.52 671.47 671.46 667.04 674.48 674.28 63 671.00 675.77 675.77 675.77 675.48 675.39 675.38 688.76 676.10 675.97 64 545.00 675.77 675.77 675.77 680.76 680.74 680.73 637.78 676.98 676.87 65 545.00 549.77 549.77 549.77 561.26 561.41 561.44 548.96 557.13 556.91 66 545.00 549.77 549.77 549.77 538.42 538.32 538.30 540.46 537.07 537.08 67 424.00 549.77 549.77 549.77 512.05 512.28 512.29 441.70 519.60 519.78 68 454.60 428.77 428.77 428.77 437.98 438.02 438.03 456.09 441.48 441.22 69 457.80 459.37 459.37 459.37 445.71 445.67 445.66 455.74 451.09 451.05 70 465.20 462.57 462.57 462.57 428.41 428.70 428.72 438.08 430.71 431.00 71 Pronóstico 469.97 469.97 469.97 477.25 477.30 477.32 429.46 482.20 481.97 En el Capítulo 4 se encuentra a detalle el análisis de los resultados mostrados en este apéndice. APÉNDICE A2 En esta sección, se muestra el análisis de residuos de manera gráfica para cada una de las medidas de desempeño utilizadas en la construcción del modelo de RNA. Este análisis es utilizado para la comprobación de los supuestos de los modelos de regresión. En las Figuras A21, A22 y A23, las gráficas de la izquierda nos permitieron comprobar el supuesto de una distribución normal en los residuos. Las de la derecha nos llevaron a concluir que los residuos cumplen con el supuesto de independencia estadística, pues no siguieron un patrón reconocido. La Figura A21, corresponde al análisis de residuos del modelo de regresión de la medida de desempeño S_Pred. La Figura A22 contiene el análisis de residuos correspondiente al modelo de regresión para el MAE y la Figura A23 representa el análisis de residuos para el del MSE. 138 Apéndice A2 139 S_Pred Probabilidad Normal de los Residuos Residuos vs. Valores Ajustados 99.9 50 25 90 Residuo Percentil 99 50 10 0 -25 -50 1 0.1 -50 -25 0 Residuo 25 50 0 Histograma de los Residuos 160 Residuos vs. Orden de los Datos 25 12 Residuo Frecuencia 80 120 Valor A justado 50 16 8 4 0 40 0 -25 -50 -60 -40 -20 0 Residuo 20 40 0 15 30 45 Orden de Observación 60 Figura A21: Gráficas para comprobación de normalidad e independencia estadística de los residuos en el modelo de regresión de S_Pred. MAE Probabilidad Normal en los Residuos Residuos vs. Valores Ajustados 3.0 99.9 1.5 90 Residuo Percentil 99 50 10 1 0.1 0.0 -1.5 -3.0 -4 -2 0 Residuo 2 5 4 16 12 1.5 8 4 0 . 20 Residuos vs. Orden de los Datos 3.0 Residuo Frecuencia Histograma de los Residuos 10 15 Valor Ajustado 0.0 -1.5 -3.0 -2.4 -1.2 0.0 Residuo 1.2 2.4 0 15 30 45 60 Orden de Observación Figura A22: Gráficas para comprobación de normalidad e independencia estadística de los residuos en el modelo de regresión del MAE. Apéndice A2 140 MSE Probabilidad Normal de los Residuos Residuos vs. Valores Ajustados 99.9 200 90 Residuo Percentil 99 50 10 -200 1 0.1 -300 0 -150 0 Residuo 150 300 0 Histograma de los Residuos 200 15 Residuo Frecuencia 800 Residuos vs. Orden de los Datos 20 10 5 0 200 400 600 Valor A justado 0 -200 -200 -100 0 Residuo 100 200 0 15 30 45 60 Orden de Observación Figura A23: Gráficas para comprobación de normalidad e independencia estadística de los residuos en el modelo de regresión del MSE. Observamos que los supuestos de normalidad e independencia estaban satisfechos, sin embargo aún nos faltaba comprobar el supuesto de varianza constante, para ello graficamos los residuos de cada uno de los metamodelos contra cada una de las variables o factores de nuestro experimento. En nuestro caso las variables fueron: neuronas, lags, escala, transformación y algoritmo. En las Figuras A24, A25 y A26 se muestran las gráficas de residuos contra variables para nuestras medidas de desempeño de S_Pred, MAE y MSE, respectivamente. A partir del comportamiento de los residuos en estas gráficas, concluimos que nuestros modelos de regresión cumplen con el supuesto de varianza constante en los residuos. Apéndice A2 141 Residuos vs. Neuronas Residuos vs. Lags 50 Residuo Residuo 50 0 0 -50 -50 2 5 2 7 3 6 Lags Neuronas Residuos vs. Escala Residuos vs. Transformación 50 Residuo Residuo 50 0 0 -50 -50 1 1 2 2 Transformación Escala Residuos vs. Algoritmo Residuo 50 0 -50 1 2 Algoritmo Figura A24: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza en los residuos del modelo de regresión de la S_Pred. Apéndice A2 142 Residuos vs. Neuronas Residuos vs. Lags 2 Residuo Residuo 2 0 0 -2 -2 2 4 2 6 3 4 Lags Neuronas Residuos vs. Escala 6 Residuos vs. Transformación 2 Residuo 2 Residuo 5 0 0 -2 -2 1 2 1 2 Transformación Escala Residuos vs. Algoritmo Residuo 2 0 -2 1 2 Algoritmo Figura A25: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza en los residuos del modelo de regresión del MAE. Apéndice A2 143 Residuos vs. Neuronas Residuals Versus Lags 200 Residuo Residuo 200 0 -200 0 -200 2 5 7 2 3 6 Neuronas Lags Residuos vs. Escala Residuos vs. Transformación 200 Residuo Residuo 200 0 -200 0 -200 1 2 1 Escala 2 Transformación Residuos vs. s Algoritmo Residuo 200 0 -200 1 2 Algoritmo Figura A26: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza en los residuos del modelo de regresión del MSE. Apéndice A2 144 Una vez realizado el análisis de los residuos y habiendo comprobado los supuestos bajo los cuales se desarrollaron los modelos, concluimos que los metamodelos eran apropiados para describir el comportamiento de nuestras medidas de desempeño, así que procedimos con la fase de optimización tomando como base los modelos encontrados (metamodelos). Como puede observarse, en este caso es fácil comprobar los supuestos, sin embargo no siempre sucede de esta manera, así que es necesario recurrir a técnicas estadísticas para llevar a cabo tal comprobación. APÉNDICE A3 En este apartado, podemos observar los resultados obtenidos al optimizar los modelos de optimización resultantes en cada una de las medidas de desempeño. Las soluciones indican el valor que toma cada uno de los parámetros en el modelo de RNA. Recordemos que estamos utilizando los parámetros: neuronas, lags, escala, transformación y algoritmo. De esta manera, el primer elemento de la solución indica la cantidad de neuronas en la capa oculta, el segundo corresponde al número de lags, el tercero al tipo de escala, el cuarto a la transformación y por último el algoritmo de entrenamiento. Para una explicación más amplia de la codificación de las soluciones, se puede recurrir al Capítulo 4. Al tratarse de problemas de optimización no convexos, se utilizaron múltiples soluciones iniciales para optimizar cada uno de los modelo. La primera columna de las siguientes tablas, contiene las soluciones que fueron utilizadas como punto de inicio para la realización de la optimización, en la segunda columna se muestra la solución final que encontró el optimizador a partir de la solución inicial y por último, la tercera columna contiene la evaluación de la solución final en la función objetivo. A continuación, se muestran los resultados obtenidos en cada una de las medidas de desempeño. 145 Apéndice A3 146 Tabla A31: Resultados de la optimización del MAE. Solución Inicial 2,2,1,1,1 5,3,1,1,1 7,6,1,1,1 2,2,2,2,2 5,3,2,2,2 7,6,2,2,2 MAE Solución Final 2,2,1,1,2 7,6,2,2,1 7,6,2,2,1 7,6,2,2,1 7,6,2,2,1 7,6,2,2,2 Valor Objetivo 13.730 3.295 3.295 3.295 3.295 3.295 Tabla A32: Resultados de la optimización del MSE. Solución Inicial 2,2,1,1,1 5,3,1,1,1 7,6,1,1,1 2,2,2,2,2 5,3,2,2,2 7,6,2,2,2 MSE Solución Final 2,2,1,1,2 7,6,2,2,1 7,6,2,2,1 7,6,2,2,1 7,6,2,2,1 7,6,2,2,1 Valor Objetivo 578.49 -47.87 -47.87 -47.87 -47.87 -47.87 Tabla A33: Resultados de la optimización de la B_Pred. Solución Inicial 2,2,1,1,1 5,3,1,1,1 7,6,1,1,1 2,2,2,2,2 5,3,2,2,2 7,6,2,2,2 B_Pred Solución Final 2,2,1,1,2 7,6,2,2,1 7,6,2,2,2 2,2,1,1,2 7,6,2,2,1 7,6,2,2,2 Valor Objetivo 53.172 18.235 18.235 53.172 18.235 18.235 Apéndice A3 147 Tabla A34: Resultados de la optimización de la S_Pred. Solución Inicial 2,2,1,1,1 5,3,1,1,1 7,6,1,1,1 2,2,2,2,2 5,3,2,2,2 7,6,2,2,2 S_Pred Solución Final 2,2,1,1,2 7,2,2,2,1 7,6,2,2,1 2,2,1,1,2 7,2,2,2,1 7,6,2,2,1 Valor Objetivo 91.737 48.535 6.183 91.737 48.535 6.183 Como puede observarse, existe una solución a la cual convergieron todas las medidas de desempeño, tal solución es la (7,6,2,2,1). Esta solución nos indicó el mejor valor que debían tomar los parámetros, para obtener un modelo de RNA con buen desempeño que diera como resultados pronósticos confiables. Una descripción detallada se encuentra en el Capítulo 4. APÉNDICE B1 A continuación se muestran los pronósticos que se obtuvieron para los siguientes doce períodos en los modelos de RNAs construidos a partir de las combinaciones de los parámetros lags y neuronas en el diseño de experimentos. En la Tabla B11 la primera y segunda columna contienen el valor al cual fueron fijados los parámetros lags y neuronas respectivamente, mientras que las columnas siguientes contienen el valor del pronóstico para doce períodos adelante. Tabla B11: Pronóstico de los modelos de RNAs experimentales, Serie 1. Parámetros PRONÓSTICO Lags Neuronas Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes 10 Mes 11 Mes 12 3 2 459 469 477 486 499 508 515 525 529 530 540 544 3 4 469 473 479 491 495 501 510 524 565 590 612 644 3 6 421 427 431 441 456 476 507 540 572 596 612 626 3 8 428 433 363 399 414 397 441 428 298 543 331 234 3 10 461 471 480 488 501 510 517 527 531 532 542 546 6 2 515 525 539 544 556 564 574 583 587 589 591 593 6 4 497 512 527 555 572 577 605 612 641 703 750 744 6 6 369 401 820 783 1,036 826 376 391 313 928 1,432 1,497 6 8 632 853 1,524 1,859 2,234 2,305 1,984 2,048 1,858 1,939 2,277 1,952 6 10 427 436 449 456 468 477 489 499 506 512 517 522 9 2 524 533 551 555 569 577 583 589 602 606 612 625 9 4 843 807 784 753 740 747 736 729 650 584 512 462 9 6 661 657 599 607 610 632 661 659 550 515 517 428 148 Apéndice B1 149 Continuación Tabla B11: Pronóstico de los modelos de RNAs experimentales, Serie 1. Parámetros Lags PRONÓSTICO Neuronas Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes 10 Mes 11 Mes 12 9 8 452 460 472 477 491 500 508 518 523 525 530 536 9 10 522 386 332 260 757 383 828 704 640 905 323 1,549 12 2 526 539 561 568 582 589 598 610 635 640 650 654 12 4 617 675 741 793 871 897 944 961 982 950 947 873 12 6 464 478 487 493 505 512 521 533 540 543 551 549 12 8 464 478 487 493 505 512 521 533 540 543 551 549 12 10 464 478 487 493 505 512 521 533 540 543 551 549 15 2 586 595 604 617 625 633 638 634 647 652 672 683 15 4 471 482 490 504 512 519 535 543 548 557 562 559 15 6 471 482 490 504 512 519 535 543 548 572 562 559 15 8 471 482 490 504 512 519 535 543 548 557 562 559 15 10 471 482 490 504 512 519 535 543 548 557 562 559 APÉNDICE B2 En esta sección, se muestra el análisis de residuos de manera gráfica para cada una de las medidas de desempeño utilizadas en la construcción del modelo de RNA para el análisis de la Serie 1. Este análisis es utilizado para la comprobación de los supuestos de los modelos de regresión. En la Figura B21 se muestran los resultados del análisis de residuos del modelo de regresión de la medida de desempeño MSE_T, que corresponde al MSE de entrenamiento. La Figura B22 contiene los resultados del análisis de residuos para el modelo de aproximación del MSE_V o MSE de validación. En la Figura B21 y en la Figura B22, las gráficas de la izquierda nos permiten comprobar el supuesto de una distribución normal en los residuos. Las gráficas de la derecha son utilizadas para comprobar la independencia estadística en los residuos. Se dice que se cumple el supuesto de independencia siempre y cuando el comportamiento de los residuos no siga algún patrón reconocido. Para comprobar el supuesto de varianza constante, se utilizan las gráficas de residuos contra variables. La Figura B23 muestra las gráficas correspondientes a los residuos de las medidas de desempeño MSE_T y MSE_V experimento. 150 contra los factores utilizados en el Apéndice B2 151 MSE_T Probabilidad Normal Residuos vs. Valor Ajustado 99 200 Residuo Percentil 90 50 10 1 -500 -250 0 Residuo 250 0 -200 -400 500 0 Histograma de los Residuos 1000 1500 Valor ajustado 2000 Residuos vs. Orden de los Datos 2.0 200 1.5 Residuo Frecuencia 500 1.0 0.5 0.0 -400 -200 0 200 Residuo 0 -200 -400 400 1 2 3 4 5 6 7 Orden de Observación 8 9 Figura B21: Gráficas de Residuos para el MSE_T, Serie 1. MSE_V Residuos vs. Valores Ajustados 200 90 100 Residuo Percentil Probabilidad Normal 99 50 10 1 -200 -100 0 Residuo 100 0 -100 -200 200 600 200 1.5 100 1.0 0 -100 0.5 0.0 1800 Residuos vs. Orden de los Datos 2.0 Residuo Frecuencia Histograma de los Residuos 900 1200 1500 Valor Ajustado -200 -100 0 Residuo 100 200 -200 1 2 3 4 5 6 7 Orden de Observación Figura B22: Gráficas de Residuos para el MSE_V, Serie 1. 8 9 152 Residuos vs. Lags Residuos vs. Neuronas ( MSE_T) (MSE_T) 200 200 0 0 Residuo Residuo Apéndice B2 -200 -200 -400 -400 3.0 4.5 6.0 7.5 9.0 2 3 Lags Residuos vs. Lags 5 6 5 6 Residuos vs. Neuronas (MSE_V) (MSE_V) 200 200 100 100 Residuo Residuo 4 Neuronas 0 -100 0 -100 -200 -200 3.0 4.5 6.0 7.5 Lags 9.0 2 3 4 Neuronas Figura B23: Gráficas de residuos contra variables, Serie 1. En las gráficas de las Figuras B21, B22 y B23 fue posible comprobar los supuestos de independencia y varianza constante en los residuos, sin embargo el supuesto de normalidad no se visualizó directamente de las gráficas de histogramas. Por esta razón decidimos hacer una prueba formal de normalidad en los residuos. Los resultados de esta prueba se muestran en la Figura B24. En la Figura B24 se muestran los resultados de la prueba formal de normalidad en los residuos para las dos medidas de desempeño utilizadas. A través de la prueba obtuvimos el valor P que nos sirve para realizar la prueba de hipótesis en la cual se toma como hipótesis nula que los residuos son normales y como hipótesis alternativa que no lo son. Por esta razón, en esta prueba son deseables valores de P grandes que nos permitan Apéndice B2 153 concluir con cierto grado de significancia que se acepta la hipótesis nula. Se observó que para ambos casos: MSE_T y MSE_V los valores de P están por encima de 0.15, así que con un grado de significancia menor o igual a este valor P se concluye que los residuos cumplen con el supuesto de normalidad. MSE_T 99 Media 7.7054E-13 Desviación Estandard 221.0 N 9 KS 0.206 Valor P >0.150 P er centil 90 50 10 1 -500 -250 0 Residuo 250 500 MSE_V 99 Media -8.5265E-14 Desviación Estandard 112.6 N 9 KS 0.093 Valor P >0.150 P er centil 90 50 10 1 -300 -200 -100 0 Residuo 100 200 300 Figura B24: Resultados del análisis formal de normalidad en los residuos, Serie 1. El análisis de los residuos resultó satisfactorio, por lo tanto concluimos que los metamodelos (modelos de regresión) para cada medida de desempeño eran adecuados y de acuerdo a la metodología procedimos con la fase de optimización. Ésta fase se describe en el Capítulo 4. APÉNDICE B3 Este apéndice contiene los pronósticos que se obtuvieron para los siguientes doce períodos en los modelos de RNAs construidos a partir de las combinaciones de los parámetros lags y neuronas en el diseño de experimentos, en el análisis de la serie 2. En la Tabla B31, la primera y segunda columna contienen el valor al cual fueron fijados los parámetros lags y neuronas respectivamente, mientras que las columnas siguientes contienen el valor del pronóstico para doce períodos adelante. Tabla B31: Pronóstico de los modelos de RNAs experimentales, Serie 2. Parámetros Lags Neuronas PRONÓSTICO Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes 10 Mes 11 Mes 12 3 2 104.66 108.00 115.00 122.00 129.00 134.81 140.58 146.85 154.29 157.00 164.00 170.00 3 4 104.65 108.00 117.00 123.00 131.00 135.00 141.13 145.36 154.40 157.00 168.00 175.00 3 6 76.97 79.40 83.00 86.00 90.00 93.06 96.74 100.53 100.96 100.00 104.00 107.00 4 2 76.12 80.20 82.00 84.20 86.30 89.89 93.82 96.63 97.21 101.00 101.00 99.30 4 4 101.59 106.00 110.00 114.00 120.00 130.01 140.85 150.66 162.12 173.00 190.00 193.00 4 6 76.12 80.20 82.00 84.20 86.30 89.89 93.82 96.63 97.21 101.00 101.00 99.30 6 2 48.40 51.00 53.40 57.10 62.50 66.89 67.83 70.10 84.95 99.40 108.00 111.00 6 4 79.42 81.50 83.30 86.60 90.40 94.28 96.75 99.82 99.83 99.90 99.90 102.00 6 6 79.42 81.50 83.30 86.60 90.40 94.28 96.75 99.82 99.83 99.90 99.90 102.00 Puesto que se observó que el área experimental podía redefinirse para obtener metamodelos más confiables, se desarrolló el nuevo experimento, los resultados están contenidos en el Apéndice B4. 154 APÉNDICE B4 En este apartado se muestran los pronósticos que se obtuvieron para los siguientes doce períodos en los modelos de RNAs construidos a partir de las combinaciones de los parámetros lags y neuronas en el diseño de experimentos para la Serie 2, considerando el experimento enfocado. En la Tabla B41 la primera y segunda columna contienen el valor al cual fueron fijados los parámetros lags y neuronas respectivamente, mientras que las columnas siguientes contienen el valor del pronóstico para doce períodos adelante. Tabla B41: Pronóstico de los modelos de RNAs experimentales, experimento enfocado Serie 2. Parámetros Lags Neuronas 3 3 PRONÓSTICO Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 106.28 109.71 118.95 120.54 128.85 136.65 Mes 7 Mes 8 Mes 9 Mes 10 Mes 11 Mes 12 145.4 148.25 155.69 159.68 166.86 171.14 3 4 102.04 105.55 116.29 117.84 127.17 135.43 144.6 146.95 157.99 167.88 175.81 181.01 4 3 101.91 107.01 111.63 116.05 126.02 137.16 147.53 154.57 163.54 185.51 192.26 195.46 4 4 115.81 108.39 111.76 116.68 127.49 135.91 145.75 160.64 170.83 159.11 164.17 195.75 5 3 157.66 163.35 162.21 164.39 165.14 166.00 173.06 176.37 185.98 191.06 205.49 211.70 5 4 105.01 111.30 114.72 116.7 119.56 124.21 129.30 132.27 140.11 146.20 138.92 130.82 6 3 137.81 143.69 155.9 164.2 181.03 196.35 203.54 220.6 318.36 339.13 291.13 303.64 6 4 131.26 133.78 155.8 171.82 182.96 189.35 190.26 188.89 194.03 196.83 195.02 199.63 155 APÉNDICE B5 En esta sección, se muestra el análisis de residuos de manera gráfica para cada una de las medidas de desempeño utilizadas en la construcción del modelo de RNA. Este análisis es utilizado para la comprobación de los supuestos de los modelos de regresión. La Figura B51, B52 y B53 contienen las gráficas de residuos correspondientes a los modelos de regresión que aproximan las medidas de desempeño MSE_T y MSE_V .En la Figura B51 y en la Figura B52, las gráficas de la izquierda permiten la comprobación del supuesto de normalidad, las de la derecha se utilizan para la comprobación del supuesto de independencia estadística. 156 Apéndice B5 157 MSE_T Probabilidad Normal Residuos vs. Valores Ajustados 99 10 Residuo Percentil 90 50 10 5 0 -5 1 -10 0 Residuo 10 70 Histograma de los residuos 100 Residuos vs. Orden de los Datos 3 10 2 Residuo Frecuencia 80 90 Valor A justado 1 5 0 -5 0 -12 -8 -4 0 4 Residuo 8 12 1 2 3 4 5 6 Orden de Observación 7 8 Figura B51: Gráficas de Residuos para el MSE_T, Serie 2. MSE_V Residuos vs. Valores Ajustados 80 90 40 Residuo Percentil Probabilidad Normal 99 50 10 1 -100 -50 0 Residuo 50 0 -40 -80 100 200 80 1.5 40 1.0 0 -40 0.5 0.0 500 Residuos vs. Orden de los Datos 2.0 Residuo Frecuencia Histograma de los Residuos 300 400 Valor A justado -80 -40 0 Residuo 40 80 -80 1 2 3 4 5 6 Orden de Observación Figura B52: Gráficas de Residuos para el MSE_V, Serie 2. 7 8 Apéndice B5 158 Residuos vs. Lags Residuos vs. Neuronas ( MSE_T ) ( MSE_T) 10 5 5 Residuo Residuo 10 0 0 -5 -5 3 4 5 6 3 4 Lags Neuronas Residuos vs. Lags Residuos vs. Neuronas (MSE_V) 80 40 40 Residuo Residuo (M SE_V) 80 0 -40 0 -40 -80 -80 3 4 5 6 3 Lags 4 Neuronas Figura B53: Gráficas de residuos contra variables, Serie 2. Para comprobar el supuesto de varianza constante, nos auxiliamos de las gráficas de residuos contra factores. Estas gráficas se muestran en la Figura B53. Analizando las gráficas de las Figuras B51, B52 y B53, concluimos que los supuestos de independencia estadística y varianza constante en los residuos de los modelos de cada medida de desempeño utilizada fueron cumplidos, sin embargo, a prueba de normalidad no era muy clara en los histogramas. Hicimos una prueba formal de normalidad en los residuos para asegurarnos que los metamodelos eran adecuados para describir nuestras medidas de desempeño y de esta manera continuar con la metodología. En la Figura B54 se muestran los resultados obtenidos, la interpretación de los mismos es similar a la de la Figura B23 del Apéndice B2. Pudo observarse que para un nivel de significancia menor a 0.15 se concluye que los residuos cumplen con el supuesto de normalidad, para ambas medidas de desempeño. Concluimos que los metamodelos son adecuados y proseguimos con la metodología, se sugiere consultar el Capítulo 5. Apéndice B5 159 MSE_T 99 P er centil 90 Media -2.1205E-14 Desviación Estandard 6.128 N 8 KS 0.198 Valor P >0.150 50 10 1 -1 5 -1 0 -5 0 Residuo 5 10 15 MSE_V 99 P er centil 90 Media -6.2438E-13 Desviación Estandard 44.53 N 8 KS 0.156 Valor P >0.150 50 10 1 -1 0 0 -5 0 0 Residuo 50 100 Figura B54: Resultados del análisis formal de normalidad en los residuos, Serie 2. APÉNDICE C A continuación se presenta el Código fuente en lenguaje Matlab, que fue construido para la instauración de la herramienta de toma de decisiones. Los siguientes cuatro programas constituyen la columna vertebral del generador y ejecutor del Diseño de Experimentos Factorial, posteriormente se muestra el código utilizado para las inicializaciones múltiples. Programa: Hacer_Experimento.m Función: Se encarga de generar y ejecutar un Diseño de Experimentos de tipo factorial, considerando como factores el parámetro Lags y Neuronas. Entradas: 1.-Conjunto de datos históricos (serie de tiempo) 2.-Posibles valores del parámetro lags 3.-Posibles valores del parámetro neuronas 4.-Nombre del archivo.xls donde se imprimiran los resultados del experimento 160 Apéndice C Código Fuente: function Hacer_Experimento(info,lags,neuronas,archivo) %Indica la cantidad de periodos que se desean pronosticar % Corresponde al número de neuronas en la capa de salida periodos=12; %Algoritmo de entrenamiento,(retropropagación del error) alg='trainlm'; %Cardinalidad del conjunto de patrones que se utilizarán para validación dim_v=15; %Cantidad de actualizaciones de los pesos en la RNA epocas=1200; % Será utilizado como identificador de los archivos en los que se % almacenarán los modelo de RNA para cada combinación factorial total=1; %Obtención de la cantidad de niveles en cada factor [nivel_l,y]=size(lags); [nivel_n,r]=size(neuronas); %Para asegurarse que la variable nivel_x tiene el número correcto de %niveles de la variable x if nivel_l<y nivel_l=y; end if nivel_n<r nivel_n=r; end 161 Apéndice C 162 %Los resultados del experimento se van a almacenar en un archivo, éste %contendrá los valores que obtienen las medidas de desempeño así como los nombres de los archivos que contienen la información completa del %modelo de red correspondiente a la prueba. % Abre el archivo.xls para imprimir en el el resultado del experimento %Se imprimirá los valores específicos de cada Factor experimental resultado=fopen(archivo,'a+') if resultado==-1 printf('Error, no se pudo crear el archivo\n'); exit(1); else fprintf(resultado,'Experimento realizado con lags a %d niveles y neuronas a %d niveles\n',nivel_l,nivel_n); fprintf(resultado,'\nLags\n') fprintf(resultado,'%d\n',lags); fprintf(resultado,'\nNeuronas\n') fprintf(resultado,'%d\n',neuronas); fprintf(resultado,'\nArchivo\t\tInicio\t\tLags\t\tNeuronas\t\tMSE_Training\t\tMSE_Valida tion\t\tMSE_RandomWalk\n'); fprintf(resultado,'\n'); fclose(resultado); end %Ciclo que se encarga de generar una a una las combinaciones factoriales %Fija el factor Lags y recorre el Factor neuronas for i=1:nivel_l %Llama la función que se encarga de generar las matrices que contendrán Apéndice C 163 %los patrones de entrenamiento y validación [P,T,P_V,T_V,indices_v,indices_t,t]=seleccion(info,lags(i),periodos,dim_v); %Ciclo para cambiar el valor del factor neuronas for j=1:nivel_n %Llama a la Función prediccion_m que se encarga de entrenar y validar un conjunto de RNAs utilizando diferentes inicializaciones en los pesos de las conexiones. %Esta Función regresa la mejor de las RNAs creadas. %Selecciona como mejor RNA aquella con menor error de validación %Devuelve además, el valor del pronóstico, las medidas de desempeño %asociadas y un identificador para determinar el tipo de inicialización %utilizada. [pos,forecast,MSE_RandomWalk,MSE_Training,MSE_Validation,mejor] prediccion_m(info,P,T,P_V,T_V,lags(i),neuronas(j),epocas,alg,periodos); %Selecciona la funcion de inicializacion switch(pos) case 1 inicio='initzero'; case 2 inicio='midpoint'; case 3 inicio='rands'; case 4 inicio='inicio_med1'; case 5 = Apéndice C 164 inicio='inicio_med2'; case 6 inicio='inicio_min'; case 7 inicio='inicio_max', end %Renombrar el archivo que contiene la información completa de la red que %generó estos resultados en las medidas de desempeño nuevo_nombre=strcat(int2str(total),'.mat'); movefile(mejor,nuevo_nombre); total=total+1; %Imprime en el archivo.xls los resultados correspondientes resultado=fopen(archivo,'a+'); if resultado==-1 printf('Error al accesar al archivo'); exit(1); else fprintf(resultado,'%s\t\t%s\t\t%d\t\t%d\t\t%.4f\t\t%.4f\t\t%.4f\t\t%.4f\t\t',nuevo_nombre,i nicio,lags(i),neuronas(j),MSE_Training,MSE_Validation,MSE_RandomWalk,forecast); fprintf(resultado,'\n'); end fclose(resultado); Apéndice C 165 clear nuevo_nombre; end end Programa: seleccion.m Función: Es utilizada para crear los patrones disponibles dependiendo de las observaciones disponibles. Los patrones son separados en dos conjuntos, uno de validación y otro de entrenamiento para el diseño de una RNA. El primero es seleccionado de manera aleatoria, de acuerdo a una distribución uniforme sin reemplazo. Entradas: 1.-observaciones: vector columna que contiene la serie de tiempo 2.-lags: cantidad de datos históricos 3.-periodos:cantidad de neuronas de salida (pronósticos) 4.-cantidad: cardinalidad de patrones de validación Código Fuente: function [P,T,P_V,T_V,posiciones_v,posiciones_t,t] (observaciones,lags,periodos,cantidad) %obtiene la cantidad de datos en la serie de tiempo = seleccion Apéndice C [n,m]=size(observaciones); if m>n n=m; observaciones=observaciones'; end %Para crear matrices temporales devuelve matriz de lagsXQ y 12XQ temp_P=crear(observaciones(1:n-periodos,1),lags); temp_T=crear(observaciones(lags+1:n,1),periodos); [r,t]=size(temp_P); %Crea un vector con las posiciones de los patrones que se utilizarán para %el conjunto de validación, de acuerdo a una distribución uniforme sin %reemplazo validacion=randsample(t,cantidad); validacion=sort(validacion); posiciones_v=validacion'; c=1; ban=0; d=1; %Se crean las matrices de los patrones de validación %P_V serán las entradas y T_V las salidas, juntos forman los patrones de %validación P_V=temp_P(:,validacion); T_V=temp_T(:,validacion); 166 Apéndice C 167 %En el siguiente ciclo, se seleccionan de los patrones disponibles, %aquéllos que no forman parte del conjunto de validación for i=1:t if (c<=cantidad & i== validacion(c)) c=c+1; ban=1; end if ban==0 P(:,d)=temp_P(:,i); T(:,d)=temp_T(:,i); posiciones_t(d)=i; d=d+1; else ban=0; end end t=n; Programa: prediccion.m Función: Utiliza las matrices P y T definidas con anterioridad, esto es cuando ya se han elaborado los valores estimados de las ultimas observaciones P es matriz de lagsx(n-lags) y T es matriz de Periodosx(n-lags) Inicializa de 7 formas distintas los pesos de la red con cada una de estas formas se entrena y valida la red. Luego se comparan todos los MSE_V para regresar la red que tiene el menor de todos. Apéndice C 168 Considera caminata aleatoria para comparar los resultados Entradas: 1.- info: incluye toda la informacion que incluye P, T, P_V y T_V 2.- lags: cuantos datos historicos se desean considerar para el pronostico 3.- neuronas: cuantas neuronas contendra la capa oculta de la red 4.- epocas: parametro de finalizacion del entrenamiento 5.- alg: algoritmo de entrenamiento 6.- periodos: horizontes de prediccion Código Fuente: function [pos,next,MSE_RandomWalk,MSE_T,MSE_V,mejor] prediccion_m(info,P,T,P_V,T_V,lags,neuronas,epocas,alg,periodos) %Estos arreglos de cadenas se utilizaran para almacenar cada uno de los %resultados de las redes creadas en archivos con diferentes nombres, aux2 %representa el tipo de inicializacion de pesos de la red, aux se utiliza %cuando se quieren realizar hasta 10 replicas con la misma inicializacion aux={'11';'12';'13';'14';'15';'16';'17';'18';'19';'20'}; aux2={'cero';'midp';'rand';'med1';'med2';'_min';'_max'}; aux2=char(aux2); aux=char(aux); %Cálculo de MSE de Random Walk MSE_RandomWalk=ErrorRandWalk(info) = Apéndice C 169 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % PREPROCESAMIENTO DE DATOS %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %Obtencion del valor minimo y maximo de las observaciones [x,y]=size(info) minimo=min(info); maximo=max(info); %Aquí periodos indica cuantos se van a predecir en la red %Para obtener la informacion que realmente se utilizo al crear P y T datas=info(:,1); ultimos=zeros(periodos,1); t=x; %Los datos de la serie son escalados a [-1, 1], para futuras referencias conjunto=2.*(datas-minimo)./(maximo-minimo)-1; %El valor de t es para registrar en total cuantos datos considere para formar P y T. clear info; %Los elementos de las matrices de patrones de entrenamiento y validación %se escalan a [-1, 1] P=2.*(P-minimo)./(maximo-minimo)-1; T=2.*(T-minimo)./(maximo-minimo)-1; P_V=2.*(P_V-minimo)./(maximo-minimo)-1; Apéndice C T_V=2.*(T_V-minimo)./(maximo-minimo)-1; for i=1:7 %El peor de los casos el MSE_V tendrá este valor MSE_Val(1)=10000000000; contador=1; corrida=1; switch(i) case 1 inicio='initzero'; case 2 inicio='midpoint'; case 3 inicio='rands'; corrida=3; case 4 inicio='inicio_med1'; case 5 inicio='inicio_med2'; case 6 inicio='inicio_min'; case 7 inicio='inicio_max', 170 Apéndice C 171 end actual=contador; nombres(contador,:)=strcat(aux2(i,:),aux(contador,:)); nombres=char(nombres); %Llama a la funcion que crea, entrena y valida una red de múltiples %salidas, indicando la inicialización de pesos, los patrones de %entrenamiento y validación así como el algoritmo de entrenamiento [next_ind(contador,:),MSE_Val(contador),MSE_Train(contador)]=red_multiple(inicio,al g,nombres(contador,:),P,T,P_V,T_V,neuronas,periodos,t,epocas,minimo,maximo,conjun to,ultimos,datas,i); min_next=min(next_ind(contador,:)); %Si los pronósticos obtenidos por la RNA no tienen sentido, es decir son %negativos, entonces se le pone al modelo de RNA correspondiente un valor %de MSE_V muy grande con el propósito de que no sea atractivo para la %selección del mejor modelo. if min_next<0 MSE_Val(contador)=1000000000000; end contador=contador+1; actual=contador-1; cont=contador %Para guardar en archivos con nombres que se utilicen para referenciar %posteriormente los archivos de las RNAs creadas, de acuerdo a la %inicialización utilizada. Así como las medidas de desempeño obtenidas %en cada RNA para posteriormente obtener la mejor de ellas. [chico,pos]=min(MSE_Val); Apéndice C 172 for e=1:contador-1 nombre=strcat(nombres(e,:),'.mat'); if e~= pos delete (nombre); else mejores(i,:)=nombre; MSE_Training(i)=MSE_Train(e); MSE_Validation(i)=MSE_Val(e); forecast(i,:)=next_ind(e,:); end clear nombre; end clear nombres MSE_Val MSE_Train next_ind; end %Cierra for %Para obtener la red que tuvo el MSE_Validation mas pequeño de todas %las inicializaciones, esa es la informacion que regresa esta función %Una RNA con mejor desempeño,los valores del MSE_T y MSE_V, el %pronóstico y el tipo de inicialización utilizada en esa RNA [menor,pos]=min(MSE_Validation); for e=1:i nombre=mejores(e,:); nombre=char(nombre); if e~= pos delete (nombre); Apéndice C 173 else mejor=nombre; MSE_T=MSE_Training(e); MSE_V=MSE_Validation(e); next=forecast(e,:); end clear nombre; end clear mejores MSE_Training MSE_Validation forecast e menor; Programa: red_multiple.m Función: Crea una red neuronal para prediccion de multiples periodos, inicializa los pesos de manera sistemática, entrena, valida y predice. Almacena los resusltados del modelo de RNA en un archivo.m Regresa el pronóstico y el valor de las medidas de desempeño MSE_V y MSE_T. Entradas: 1.- Inicio: indica que función de inicialización de pesos va a utilizar para crear el modelo de RNA. 2.- alg: Corresponde al algoritmo de entrenamiento 3.- nombre del archivo donde almacenará los resultados. 4.-Matrices P, T, P_V y T_V que contienen patrones de entrenamiento y Apéndice C 174 patrones de validación del modelo. 5.- Otros que ayudan al funcionamiento de la función. Esta función es utilizada por la función prediccion_m Código Fuente: function [next,MSE_Validation,MSE_Training] = red_multiple(inicio,alg,nombre,P,T,P_V,T_V,neuronas,periodos,t,epocas,minimo,maxi mo,conjunto,ultimos,datas,ind) %calcular las dimensiones de P [m,n]=size(P); %Creacion de indices para identificar las observaciones lags=m; i=1:lags; total=1:t; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %DEFINICION DE LA RED %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %Define una RNA feedforward con retropropagación red=newff(minmax(P),[neuronas,periodos],{'tansig','purelin'},alg); %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%% Apéndice C 175 %INICIALIZACION DE LOS PESOS DE LAS CONEXIONES %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% red.initFcn='initlay'; %%%%%%%%%%% %Para que llame a la función inicio que se encargará de colocar los %valores iniciales en las conexiones de la RNA red.layers{1}.initFcn='initwb'; red.layers{2}.initFcn='initwb'; %Inicializa los pesos, de acuerdo a la función que se indica por ‘inicio’ red.inputWeights{1,1}.initFcn=inicio; red.layerWeights{2,1}.initFcn=inicio; red.biases{1}.initFcn=inicio; red.biases{2}.initFcn=inicio; red=init(red); %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%% % ENTRENAMIENTO %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%==================================== % Definición de Criterios de parada %==================================== %Por número de épocas o actualizaciones de los pesos Apéndice C 176 red.trainParam.epochs =epocas; %Por alcanzar la aproximación deseada red.trainParam.goal =1e-5; %Llama a la función train para entrenar la red, recibe la matriz de entrada %y la matriz de valores target. red=train(red,P,T); %Simulacion utilizando el conjunto de entrenamiento a=sim(red,P); %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %POSTPROCESAMIENTO DEL CONJUNTO DE ENTRENAMIENTO Y DEL %RESULTADO DE LA SIMULACION %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %Transformación inversa para regresar los datos a su escala natural P=minimo+.5.*(P+1).*(maximo-minimo); A=minimo+.5.*(a+1).*(maximo-minimo); T=minimo+.5.*(T+1).*(maximo-minimo); %====================================== % OBTENCION DE ERROR DE ENTRENAMIENTO %====================================== Apéndice C 177 %Cálculo de la matriz de errores Errors=T-A; %Obtencion del MSE del conjunto de entrenamiento MSE_Training=MSE(Errors) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%% % VALIDACIÓN %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%% validacion=sim(red,P_V); %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % POSTPROCESAMIENTO DEL CONJUNTO DE VALIDACION % Y DEL RESULTADO DE LA SIMULACION %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %Transformacion inversa para regresar los datos a su escala natural P_V=minimo+.5.*(P_V+1).*(maximo-minimo); V=minimo+.5.*(validacion+1).*(maximo-minimo); T_V=minimo+.5.*(T_V+1).*(maximo-minimo); %====================================== % OBTENCION DE ERROR DE VALIDACION Apéndice C 178 %====================================== %Cállculo de la matriz de errores Errors_V=T_V-V; %Obtencion del MSE del conjunto de entrenamiento MSE_Validation=MSE(Errors_V) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%% % OBTENCION DE MATRICES DE PESOS FINALES %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%% %Pesos que unen las entradas con las neuronas de la capa oculta W1_red=red.IW{1,1}; %Bias de la capa oculta B1_red=red.b{1,1} ; %Pesos que van de la capa oculta (1) a la capa de salida (2) W2_red=red.LW{2,1} ; %Bias de la capa de salida B2_red=red.b{2,1}; %Considera las ultimas lags observaciones para predecir los siguientes %periodos; nuevos=conjunto(t-lags+1:t,1) %Predice los siguientes y los guarda en next next=sim(red,nuevos); Apéndice C 179 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%% %POST-PROCESAMIENTO DEL PRONÓSTICO %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%% next=minimo+.5.*(next+1).*(maximo-minimo); err_p=ultimos-next; MSE_Pred1=MSE(err_p); clear ind d ; save (nombre); A continuación se presenta la información correspondiente a las funciones de inicialización que fueron creadas para inicializar los pesos de las conexiones de la RNA de manera sistemática. Funciones De Inicialización De Pesos Los siguientes programas son el código de las funciones de inicialización de pesos que fueron utilizadas en la construcción de las RNAs Inicialización de los pesos en 0. Se utilizó la función initzero que viene incluida en Matlab Inicialización en un punto medio en el intervalo [-1,1]. Se utilizó la función midpoint que viene en Matlab Apéndice C 180 Inicialización aleatoria en el intervalo [-1, 1]. Se utilizó la función rands que viene en Matlab Inicialización de pesos en -0.5. function w= inicio_med1(s,pr) %Funcion de inicializacion de los pesos de las conexiones de la red %Inicializa en - 0.05 if nargin < 1, error('No hay argumentos de entrada'), end if nargin == 1 w =rand(s,1).*0-0.5; % <-- colocamos nuestros propios valores iniciales, vector de pesos else r = size(pr,1); % <-- propios valores en caso de ser una matriz de pesos w = rand(s,r).*0-0..5; end Inicialización de pesos en 0.5. function w= inicio_med2(s,pr) %Funcion de inicializacion de los pesos de las conexiones de la red %Inicializa en 0.5 if nargin < 1, error('No hay argumentos de entrada'), end if nargin == 1 w =rand(s,1).*0+0.5; % <-- colocamos nuestros propios valores iniciales, vector de pesos else r = size(pr,1); % <-- propios valores en caso de ser una matriz de pesos Apéndice C 181 w = rand(s,r).*0+0..5; end Inicialización de pesos en -1. function w= inicio_min(s,pr) %Funcion de inicializacion de los pesos de las conexiones de la red %Inicializa en -1 if nargin < 1, error('No hay argumentos de entrada'), end if nargin == 1 w =rand(s,1).*0 -1; % <-- colocamos nuestros propios valores iniciales, vector de pesos else r = size(pr,1); % <-- propios valores en caso de ser una matriz de pesos w = rand(s,r).*0 -1; end Inicialización de pesos en 1. function w= inicio_max(s,pr) %Funcion de inicializacion de los pesos de las conexiones de la red %Inicializa en 1 if nargin < 1, error('No hay argumentos de entrada'), end if nargin == 1 w =rand(s,1).*0+1; % <-- colocamos nuestros propios valores iniciales, vector de pesos else r = size(pr,1); % <-- propios valores en caso de ser una matriz de pesos Apéndice C 182 w = rand(s,r).*0+1; end Los programas que se presentan en este Apéndice son los que utilizamos en el desarrollo de la metodología del Capítulo 3 para crear una RNAs con múltiples salidas. Se sugiere ver resultados en el Capítulo 5. AUTOBIOGRAFÍA MARÍA ANGÉLICA SALAZAR AGUILAR Candidata para el grado de maestro en Ciencias en Ingeniería de Sistemas Universidad Autónoma de Nuevo León Facultad de Ingeniería Mecánica y Eléctrica Tesis “PRONÓSTICO DE DEMANDA POR MEDIO DE REDES NEURONALES ARTIFICIALES (RNAs) EN LA INDUSTRIA DE TELECOMUNICACIONES” Nacida en Querétaro, Querétaro. Hija primogénita del Sr. J. Guadalupe Salazar Galindo y la Sra. Consuelo Aguilar Cárdenas. Graduada en el Instituto Tecnológico de Querétaro como Ingeniero en Sistemas Computacionales (1999-2003). Participó en el XIII Verano de Investigación Científica organizado por la Academia Mexicana de Ciencias, durante este período trabajó en la FIME de la UANL en el PISIS bajo la tutela del Dr. Roger Z. Ríos Mercado. Inició sus estudios de Maestría en Ciencias en Ingeniería de Sistemas en Enero de 2004 con el apoyo del PISIS y una beca de manutención otorgada por el CONACYT. En Septiembre de 2005 realizó una estancia de intercambio académico en la Ohio State University en colaboración con el Dr. Mauricio Cabrera Ríos y el Dr. José M. Castro. 183