Download Capítulo1. Introducción - Posgrado en Ingeniería de Sistemas

Document related concepts

Red neuronal artificial wikipedia , lookup

Suavizamiento exponencial wikipedia , lookup

Perceptrón multicapa wikipedia , lookup

ART (RNA) wikipedia , lookup

Pronóstico (estadística) wikipedia , lookup

Transcript
UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA DIVISIÓN DE ESTUDIOS DE POSGRADO “PRONÓSTICO DE DEMANDA POR MEDIO DE REDES NEURONALES ARTIFICIALES (RNAs) EN LA INDUSTRIA DE TELECOMUNICACIONES” POR MARÍA ANGÉLICA SALAZAR AGUILAR TESIS EN OPCIÓN AL GRADO DE MAESTRO EN CIENCIAS EN INGENIERÍA DE SISTEMAS San Nicolás de los Garza, N. L. Noviembre de 2005 UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA DIVISIÓN DE ESTUDIOS DE POSGRADO “PRONÓSTICO DE DEMANDA POR MEDIO DE REDES NEURONALES ARTIFICIALES (RNAs) EN LA INDUSTRIA DE TELECOMUNICACIONES” POR MARÍA ANGÉLICA SALAZAR AGUILAR TESIS EN OPCIÓN AL GRADO DE MAESTRO EN CIENCIAS EN INGENIERÍA DE SISTEMAS San Nicolás de los Garza, N. L. Noviembre de 2005 UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN Facultad de Ingeniería Mecánica y Eléctrica División de Estudios de Posgrado Los miembros del Comité de Tesis recomendamos que la tesis “Pronóstico de
Demanda por medio de Redes Neuronales Artificiales (RNAs) en la Industria de
Telecomunicaciones”, realizada por la alumna María Angélica Salazar Aguilar con
número de matrícula 01294370, sea aceptada para su defensa como opción al grado de
Maestro en Ciencias en Ingeniería de Sistemas.
El Comité de Tesis Dr. Mauricio Cabrera Ríos
Asesor Dr. J. Arturo Berrones Santos
Revisor
Dr. Francisco R. Angel‐Bello Acosta Revisor
Dr. Guadalupe Alan Castillo Rodríguez Subdirector División de Estudios de Posgrado Ciudad Universitaria, Noviembre de 2005 “La incertidumbre es una margarita cuyos pétalos no se terminan jamás de deshojar…” A Dios, Mi fuente inagotable de vida.
A mi familia, Mi más preciado tesoro.
RESUMEN
Una de las tareas más importantes en el ámbito de los negocios es hacer pronósticos
de demanda. En el presente trabajo se realiza esta tarea utilizando modelos de Redes
Neuronales Artificiales (RNAs) con el objetivo de resolver un problema real para una
empresa de telecomunicaciones.
El principal problema al que se enfrenta la empresa es la determinación de la
capacidad requerida en la red de transmisión de manera tal que la demanda se satisfaga
al 100% sin incurrir en costos excesivos por mantener capacidad instalada no utilizada.
Por ello, es de vital importancia la determinación precisa del pronóstico de demanda.
La empresa nos brindó información del comportamiento de la demanda en los
últimos años de operación. Optamos por un modelo de RNAs para pronóstico pues éstas
han sido muy utilizadas en trabajos recientes con buenos resultados. Sin embargo, el
desempeño de la RNA depende de la selección adecuada de los parámetros que
intervienen en el modelo.
La ausencia de una metodología estándar para la selección de los parámetros nos
motivó a proponer una metodología que hace uso de técnicas estadísticas y optimización
para la selección adecuada de los parámetros del modelo de RNAs en esta aplicación. El
desarrollo de esta metodología constituye una de las contribuciones más importantes de
este trabajo.
Probamos la metodología con los datos que nos brindó la empresa y finalmente
construimos modelos de RNAs para pronóstico de uno y doce períodos. En la literatura
se encontraron muy pocas referencias de RNAs para el pronóstico simultáneo de
múltiples períodos, por lo que se espera que este trabajo contribuya importantemente en
v
este aspecto. Los resultados obtenidos mediante RNAs fueron comparados contra los
que se obtuvieron con métodos lineales tradicionales y en nuestro caso, los modelos de
RNAs desarrollados de acuerdo a la metodología propuesta mostraron mejor calidad en
el pronóstico que los métodos lineales utilizados.
vi
ESTRUCTURA DE LA TESIS
La tesis está organizada de la manera siguiente:
En el Capítulo 1 se presenta la descripción general del problema, algunos
antecedentes, el método de solución propuesto, así como el objetivo, justificación e
hipótesis del mismo.
El Capítulo 2 contiene los antecedentes acerca de las diferentes áreas que se conjugan
en el desarrollo del presente trabajo, éstas son: Series de Tiempo, Redes Neuronales
Artificiales (RNAs), Análisis y Diseño de Experimentos y Optimización.
En el Capítulo 3 se describe de manera detallada la metodología propuesta para la
selección de parámetros de RNA para pronóstico de series de tiempo.
El Capítulo 4 contiene el análisis de una serie de tiempo mediante un modelo de
RNAs para predecir un solo período. El modelo de RNA fue creado siguiendo la
metodología propuesta en el Capítulo 3.
El Capítulo 5 es de los más relevantes en este trabajo. En él se describe el desarrollo
de dos modelos de RNAs para la predicción de demanda de múltiples períodos.
En el Capítulo 6 se presenta una comparación de los resultados obtenidos a partir de
métodos lineales tradicionales contra los obtenidos mediante RNAs. Los resultados aquí
descritos sustentan la validez de la metodología propuesta en el Capítulo 3.
En el Capítulo 7 se describe de manera general la herramienta de soporte a la toma de
decisiones que permite realizar un experimento de tipo factorial con modelos de RNAs.
vii
Para finalizar, el Capítulo 8 contiene las conclusiones, aportaciones y trabajo futuro.
Las referencias bibliográficas, lista de tablas, lista de figuras y los apéndices están
disponibles al finalizar la sección de capítulos.
viii
INDICE RESUMEN
v
ESTRUCTURA DE LA TESIS
vii
Capítulo 1. INTRODUCCIÓN
1
1.1. Descripción del Problema ………………...…………………………….………
1
1.2. Antecedentes …………………………………………………………….……...
3
1.3. Objetivo …………………………………………………………………………
4
1.4. Justificación …………………………………………………………………...…
5
1.5. Hipótesis ……………………………………………………………………...…
6
Capítulo 2. ANTECEDENTES
7
2.1. Análisis de Series de Tiempo ………………………………………………...…
2.2. Redes Neuronales Artificiales (RNAs) ……………………………………..…
8
10
2.2.1. Aplicaciones de las RNAs en pronósticos de series de tiempo
….....
14
2.2.2 Decisiones en la aplicación de RNAs para pronósticos de series de tiempo
………………………………………………………………..………………
19
2.3. Análisis y Diseño de Experimentos …………………………………………....
20
2.4. Optimización ………………………………………………………………..…
22
Capítulo 3. METODOLOGÍA PROPUESTA
28
3.1 Descripción de la Metodología ……………………...…………………………
29
Capítulo 4. PRONÓSTICO DE SERIES DE TIEMPO DE UN SOLO
PERÍODO
4.1. Pronóstico de Demanda en telecomunicaciones ……………...……………….
37
38
4.2. Construcción del Modelo de RNA para Pronóstico de Series de Tiempo de un solo
período ………………………………………………………………………..……
40
4.2.1. Descripción de la RNA como Sistema ………………………………
40
4.2.2. Análisis y Diseño de Experimentos ………………….………………
45
4.2.3. Metamodelación ………………………………………………….….
48
4.2.4. Problemas de Optimización y Solución ……………………………...
53
4.3. Conclusiones ……………..……………………………………………………
56
Capítulo
5.
PRONÓSTICO
DE
SERIES
DE
TIEMPO
MÚLTIPLES PERÍODOS
5.1. Pronóstico de Demanda en telecomunicaciones: múltiples períodos …………..
DE
57
58
5.2. Construcción de un Modelo de RNA para Pronóstico de Series de Tiempo de
múltiples períodos …………………………………………………………………
61
5.2.1. Descripción de la RNA como Sistema …...…….….…………...……
61
5.2.2 Análisis y Diseño de Experimentos para la Serie 1 ….……………….
65
5.2.2.1. Metamodelación ………………………….…………...…...
67
5.2.2.2. Problemas de Optimización y Solución, Serie 1 ……….….
74
5.2.3. Análisis y Diseño de Experimentos para la Serie 2 …………….…..
77
5.2.3.1. Metamodelación …………….…………………...……...…
78
5.2.3.2. Problemas de Optimización y Solución, Serie 2 ….……..…
84
5.3. Conclusiones ……………………………………………………..……………
87
Capítulo 6. COMPARACIÓN DE RESULTADOS DE RNAs CONTRA
MÉTODOS LINEALES TRADICIONALES
88
6.1. Pronóstico de demanda de un período en telecomunicaciones mediante métodos
lineales tradicionales …………………………………………………....…………
89
6.1.1. Comparación de Resultados …………...……………………………
90
6.2. Pronóstico de Demanda de n períodos en telecomunicaciones mediante métodos
lineales tradicionales ……………………………………………...……………….
92
6.2.1. Comparación de Resultados ………...………………………………
94
6.3. Conclusiones ……………………………..……………………………………
97
Capítulo
7.
INSTAURACIÓN
DE
LA
HERRAMIENTA
DE
SOPORTE A LA TOMA DE DECISIONES
98
7.1. Descripción de la herramienta de soporte a la toma de decisiones …………..
99
7.2 Conclusiones …………………………………………………………….……
104
Capítulo 8. CONCLUSIONES, CONTRIBUCIÓN Y TRABAJO
FUTURO
105
BIBLIOGRAFÍA
108
LISTA DE FIGURAS
115
LISTA DE TABLAS
119
APÉNDICES
121
Apéndice A1 ………………………….…………………………………………..
121
Apéndice A2 …………………………………….………………………………..
138
Apéndice A3 …………………………………….………………………………..
145
Apéndice B1 …………………………………….………………………………..
148
Apéndice B2 ……………………………………..…………………………...…..
150
Apéndice B3 ………………………………………………………………….…..
154
Apéndice B4 ………………………………………………………………….…..
155
Apéndice B5 ………………………………………………………………….…..
156
Apéndice C ………………………………………………………………….……
160
AUTOBIOGRAFÍA
183
CAPÍTULO 1
INTRODUCCIÓN
En toda industria, la planeación es una necesidad. Un objetivo importante de la tarea
de planear es tratar de prever lo que puede suceder en el futuro.
La motivación de este trabajo proviene de una empresa de telecomunicaciones que
tiene la necesidad de planear a nivel operacional, estratégico y táctico para mantenerse
competitiva ante las fluctuaciones de mercado y cursos de acción de sus competidores.
Esta empresa, como la mayoría de las empresas, tiene como objetivo principal generar
utilidades y brindar un alto nivel de servicio a sus clientes.
1.1. Descripción del Problema
Como se observa en la Figura 1.1, el principal recurso de la empresa es una red de
transmisión, que puede ser definida como un conjunto de equipos interconectados que
poseen una capacidad finita de transmisión. Los clientes demandan la utilización de la
red en forma estocástica.
Capítulo1. Introducción
2
Para cumplir con el alto nivel de servicio y maximizar las utilidades, la red de
transmisión debe tener capacidad suficiente para satisfacer la demanda de los clientes sin
incurrir en exceso de capacidad ociosa, dado el alto costo de los equipos. Ahora bien, le
corresponde al tomador de decisiones determinar ¿Cuál debe ser la capacidad de esta
red?.
1.
vo
jeti
b
O
n
ión
isió rmac
M
2. info a
ir
s,
mit iente y en
s
n
l
Tra us c hora
s
r
r
de lquie luga
r
a
e
u
i
c
lqu
cua
D
es em
to an
cá da 4
st n .C
ic se li
a
rv ent
ic es
io
de
m
n
co
n
ió
is ”
os m ita
rs ns fin
cu tra d
Re de ida
3. d ac
e
R ap
“c
an
er
a
¿Cómo planear la
capacidad de la
Red?
Figura 1.1. Descripción del problema de Telecomunicaciones.
El tomador de decisiones lleva a cabo un proceso de planeación de capacidad, a
través de una estimación del comportamiento futuro de la demanda. Esta estimación,
muchas veces es realizada de manera intuitiva, considerando únicamente la experiencia
del tomador de decisiones. Sin embargo, cuando es posible obtener información
Capítulo1. Introducción
3
cuantitativa acerca del comportamiento de la demanda a través del tiempo, es decir,
cuando se dispone de una serie de tiempo, una técnica típicamente utilizada es el
Análisis de Series de Tiempo. La Figura 1.2 muestra un ejemplo de una serie de tiempo.
Una vez que se tienen pronósticos, el tomador de decisiones puede determinar la
capacidad que se requiere en la red de transmisión para satisfacer la demanda. Puede
además determinar con anticipación si se requiere una expansión de capacidad,
resultando en una mejor planeación del presupuesto anual, así como en un mejor
aprovechamiento de los recursos económicos de la empresa.
800
700
Valor Registrado
600
500
400
300
200
100
0
1
7
13
19
25
31
37
43
49
t
Figura 1.2: Ejemplo de una Serie de Tiempo.
1.2. Antecedentes
Por muchos años, el análisis de series de tiempo ha estado dominado por la
utilización de métodos estadísticos lineales que se pueden implementar de manera
conveniente, sin embargo, la existencia de relaciones no lineales entre los datos pueden
limitar la aplicación de estos modelos (Makridakis et al., 1982). En la práctica es muy
posible encontrar relaciones no lineales en los datos, tal como sucede en nuestro caso de
Capítulo1. Introducción
4
estudio. Por ello es necesaria la utilización de técnicas capaces de reflejar dicho
comportamiento.
La utilización de Redes Neuronales Artificiales (RNAs) para pronósticos de series de
tiempo es relativamente nueva en la literatura, sin embargo, lo positivo de los resultados
en las aplicaciones prácticas la convierten en un área prometedora.
En nuestro caso, la empresa nos brindó información histórica de registros mensuales
acerca de la utilización de la red de transmisión de los últimos 6 años. Aprovechando
esta información, realizamos el pronóstico de la demanda para períodos posteriores,
mediante el uso de RNAs.
Al intentar desarrollar el modelo de RNAs para esta aplicación de pronóstico de
series de tiempo, nos encontramos que la exactitud del pronóstico de la RNA depende de
varias decisiones sumamente importantes en cuanto a la definición de los parámetros
que intervienen en el modelo así como de la arquitectura de RNA que se esté utilizando
(Zhang, 2004). Algunas de estas decisiones pueden ser tomadas en el proceso de
construcción del modelo, mientras que otras requieren ser especificadas antes de que
comience la modelación. Este es un problema, ya que no existe una regla establecida que
nos permita tomar tales decisiones de manera adecuada. Por esta razón, planteamos el
siguiente objetivo en este trabajo de tesis.
1.3. Objetivo
El objetivo de esta tesis consiste en proponer y probar una metodología para la
selección de parámetros de un modelo de RNAs para este caso de estudio que garantice
pronósticos confiables para hasta doce períodos. Adicionalmente se desarrollará la
herramienta computacional correspondiente con el fin de ayudar al tomador de
decisiones a planear la capacidad de la red de transmisión en la empresa de
telecomunicaciones.
Capítulo1. Introducción
5
1.4. Justificación
Decidimos analizar los datos históricos mediante RNAs ya que éstas surgieron como
una herramienta de modelación cuantitativa y han sido aplicadas con éxito en un amplio
número de problemas de predicción en casi todas las áreas de negocios, industria y
ciencia (Widrow et al., 1994). Los trabajos realizados a través de éstas han mostrado que
tienen características atractivas para la predicción y clasificación de patrones.
Además, aunque el análisis de series de tiempo ha provisto una cantidad de
herramientas estadísticas disponibles para este fin, esto es, para hacer pronósticos, la
mayoría de estas herramientas presuponen un modelo generador central con un error
aleatorio al cual se le asocia una distribución probabilística. La verificación de este
supuesto demanda un cierto nivel de entendimiento de los métodos estadísticos
utilizados. Este hecho puede dificultar la exitosa instauración de un sistema de
pronósticos en la industria.
Las redes neuronales artificiales son fáciles de utilizar y por otro lado, sus
capacidades de adaptación y de modelación no lineal las hacen atractivas para su
utilización en pronósticos de series de tiempo.
Aún cuando el comportamiento de la serie es lineal, las RNAs han mostrado ser
exitosas y competitivas como herramientas de modelación (Hwarng, 2001; Medeiros et
al., 2001; Zhang et al., 2001). A continuación se describen las hipótesis bajo las cuales
se desarrolló el presente trabajo.
Capítulo1. Introducción
6
1.5. Hipótesis
Existe una dependencia del valor de la demanda en un instante de tiempo t con los
valores registrados en instantes de tiempo anteriores a t y el modelo generador de dichos
valores es desconocido. Por otra parte, dado que la dependencia es muchas veces no
lineal, podemos capitalizar en la capacidad de las RNAs para aproximar adecuadamente
este tipo de dependencia. En la construcción de un modelo de RNAs partimos del
supuesto de que una selección adecuada de los parámetros de las RNAs traerá consigo
una precisión de pronósticos mejor que la que se puede obtener a través de métodos
basados en dependencias lineales.
CAPÍTULO 2
ANTECEDENTES
Introducción
Es del interés del área de planeación de la empresa obtener pronósticos confiables que
le permitan llevar a acabo la planeación de capacidad de la red de transmisión mediante
un buen aprovechamiento del capital. Por ello la importancia de obtener pronósticos
confiables.
La realización del pronóstico en este trabajo se llevó a cabo mediante el análisis de la
serie de tiempo utilizando RNAs. Para obtener pronósticos confiables es necesario
seleccionar de manera adecuada los parámetros que intervienen en el modelo de RNA.
No hay una metodología estándar para ajustar dichos parámetros. En este trabajo se
propone una metodología para la selección sistemática de los mismos.
En este capítulo se presenta la información teórica de diferentes técnicas integradas en
la metodología propuesta. En la Sección 2.1 se describe brevemente el análisis de series
de tiempo así como las principales aplicaciones y técnicas utilizadas para llevarlo a cabo.
La Sección 2.2 contiene los antecedentes de las RNAs, algunas aplicaciones prácticas y
cómo han sido utilizadas en el análisis de series de tiempo. En la Sección 2.3 se describe
Capítulo 2. Antecedentes
8
lo que es un análisis de experimentos de tipo factorial y por último, la Sección 2.4
contiene información básica acerca de la optimización de modelos.
2.1. Análisis de Series de Tiempo
A lo largo de la historia, pronosticar el comportamiento de algún fenómeno ha ido
adquiriendo una gran importancia que se puede ver reflejada en la diversidad de
aplicaciones desarrolladas en las diferentes áreas del conocimiento. Las situaciones en las
que se requiere un pronóstico tratan de estimar un comportamiento futuro, por tanto, el
tiempo está directamente involucrado y existe la presencia de incertidumbre.
Para la elaboración de un pronóstico se requiere especificar el punto específico en el
tiempo para el cual se desea obtener el pronóstico. La calidad del pronóstico depende en
gran medida de esta especificación, así como de la disponibilidad de la información
histórica acerca de la variable de interés. Es posible decir entonces que a mayor período
de tiempo, habrá mayor incertidumbre en pronósticos puntuales.
Existen diversas metodologías que nos permiten elaborar pronósticos. La selección de
una de ellas depende de diversos factores tales como: la relevancia y disponibilidad de
los datos históricos, el grado de exactitud deseado, el período de tiempo que se desea
pronosticar y el análisis costo- beneficio del pronóstico, entre otros.
La elaboración de pronósticos se lleva a cabo en una diversidad impresionante de
áreas que abarcan desde la familia, la escuela, hasta el gobierno y los negocios. En los
negocios para obtener ventajas comerciales competitivas en un ambiente constantemente
cambiante, los dirigentes de una organización deben tomar decisiones correctas en el
tiempo dependiendo de la información que se tenga a la mano (R. J. Kuo et al., 1999).
Sin embargo, esta decisión está orientada por rangos de tiempo que van desde muchas
horas hasta muchos años dependiendo del tipo de negocio. Esto es, el tomar una decisión
exacta en un tiempo adecuado, juega un papel muy importante en las organizaciones. En
áreas como la mercadotecnia, los pronósticos son utilizados para estimar el tamaño del
Capítulo 2. Antecedentes
9
mercado y la tendencia de precios. En finanzas es común utilizarlos en la estimación de
tasas de interés, mientras que en el área de producción un uso frecuente de éstos es para
estimar el crecimiento de líneas de producción.
Los pronósticos pueden llegar a disminuir la incertidumbre sobre el futuro,
permitiendo la elaboración de planes y campos de acción acorde a los objetivos de la
organización, también permiten tomar acciones correctivas apropiadas y a tiempo cuando
ocurren situaciones fuera de lo planeado.
Un pronóstico es, por lo general, la base para la toma de decisiones estratégicas,
tácticas y operacionales en muchas organizaciones. Dada su importancia, no es
sorprendente que se haya constituido en un área activa de investigación (Makridakis and
Wheelwright, 1987; Zhang, 2004).
Cuando es posible obtener información cuantitativa acerca del comportamiento de la
variable o fenómeno de interés a través del tiempo, es decir, cuando se dispone de una
serie de tiempo, como el ejemplo que se muestra en la Figura 1.2, el pronóstico
típicamente se realiza utilizando Análisis de Series de Tiempo.
Existen dos tipos de procedimientos de modelación de series de tiempo que se
clasifican de acuerdo a
los supuestos bajo los cuales se desarrolla el modelo:
procedimientos paramétricos y procedimientos no-paramétricos. Los procedimientos
paramétricos son aquéllos en los cuales los parámetros del modelo tienen un significado
de acuerdo a un modelo físico, químico, económico, etc. Dentro de esta clasificación se
encuentran los métodos estadísticos tradicionales tales como, promedios móviles,
suavizado exponencial, regresión y descomposición de series de tiempo. Estos métodos
han sido ampliamente utilizados durante varias décadas y todos ellos asumen que el valor
futuro de la serie de tiempo está linealmente relacionada con las observaciones pasadas.
Uno de los métodos más populares es el de promedios móviles autoregresivo integrado
(ARIMA), que fue popularizado por Box-Jenkins (1976). Por otro lado, los métodos no–
paramétricos, son aquéllos que sólo dependen de los datos y sus parámetros están libres
de interpretación o sujeción a otro modelo, tal es el caso de las RNAs.
Capítulo 2. Antecedentes
10
2.2. Redes Neuronales Artificiales (RNAs)
Las RNAs surgieron como una analogía de la neurona biológica mostrada en la
Figura 2.1, las dendritas reciben las señales de entrada procedentes de otras neuronas a
través de uniones llamadas sinapsis, el cuerpo de la neurona es llamado soma y el axón
lleva la salida de la neurona a las dendritas de otras neuronas.
Figura 2.1: Neurona Biológica.
En general, una neurona envía su salida a otras por medio de su axón. El axón lleva la
información por medio de diferencias de potencial, u ondas de corriente, que depende del
potencial de la neurona. La neurona recoge las señales por su sinapsis sumando todas las
influencias excitadoras e inhibidoras. Si las influencias excitadoras positivas dominan,
entonces la neurona da una señal positiva y manda este mensaje a otras neuronas por su
sinapsis de salida (Ghaziri , 1996).
En el caso de la Neurona Artificial representada en la Figura 2.2, ésta recibe un
conjunto de señales entradas y las acumula hasta alcanzar un umbral, una vez alcanzado
este umbral, lo transforma mediante la función de transferencia (generalmente una
función no-lineal) y envía el resultado ponderado de acuerdo a los pesos de las
conexiones hacia otras neuronas.
Entradas
Capítulo 2. Antecedentes
11
x1
w1
x2
w2
Neurona
f (w ⋅ x)
t
xi
wi
xn
wn
Salida
V1
y
Pesos
multiplicativos
Función de transferencia
Figura 2.2: Neurona Artificial.
El concepto de neurona artificial fue introducido en 1943 (McCulloch and Pitts,
1943). En la actualidad, las RNA han mostrado ser un procedimiento efectivo de
propósito general para el reconocimiento de patrones, clasificación, agrupamiento y
predicción (Ghiassi et al., 2005).
Existen diferentes tipos de RNAs dependiendo de la forma en que se interconectan las
neuronas dentro de la RNA. En pronóstico de series de tiempo, la RNA utilizada la
abrumadora mayoría de las veces, es una RNA multicapa de propagación hacia adelante
entrenada por retropropagación del error y con una neurona en la capa de salida. Tener
una sola neurona en la capa de salida indica que solamente se predice un solo período a
futuro. Esto nos da una idea del enfoque dominante en el área.
De manera general, una RNA multicapa de propagación hacia adelante (Feedforward)
está compuesta de tres o más capas formadas por conjuntos de neuronas que poseen
características similares (Figura 2.3). La primera capa se denomina capa de entrada y es
donde se recibe la información externa. La última capa es conocida como capa de salida
y es donde se obtiene la solución final del problema que se esté tratando. La capa de
entrada y la capa de salida están separadas por una o más capas denominadas capas
Capítulo 2. Antecedentes
12
ocultas, estas capas son las encargadas de brindarle flexibilidad a la RNA para aproximar
relaciones complejas entre los datos. Las neuronas en las capas adyacentes están
completamente conectadas y estas conexiones van de la capa baja a la capa alta. Por
ejemplo, en la Figura 2.3 se muestra una RNA multicapa de propagación hacia adelante,
que contiene tres capas: una capa de entrada, una capa oculta y una capa de salida. La
cantidad de neuronas en cada capa varía dependiendo de la aplicación.
W
V
ji
sj
.
.
.
.
Capa de Entrada
Capa Oculta
.
.
Capa de Salida
Figura 2.3: RNA multicapa de propagación hacia adelante.
Antes de utilizar un modelo de RNA para que realice una tarea específica, éste
necesita ser entrenado y validado. Básicamente el entrenamiento es el proceso de
determinación de los pesos de las conexiones, elementos clave del modelo de RNA. El
conocimiento que adquiere la RNA durante el entrenamiento es almacenado en los pesos
de las conexiones. Recordemos que las neuronas transforman la información que reciben
mediante la función de transferencia y la envían de manera ponderada de acuerdo a los
Capítulo 2. Antecedentes
13
pesos de las conexiones hacia las neuronas con las cuales tienen conexión. Se dice que el
entrenamiento es supervisado, cuando para cada vector de entrada (conocido como
patrón de entrenamiento) se conoce el valor de la salida (denominado salida deseada).
Los pesos de las conexiones se determinan durante el proceso de entrenamiento mediante
un algoritmo que minimiza una medida del error de aproximación de la RNA. Los
algoritmos de entrenamiento más comunes son los de retropropagación del error tales
como Levenberg-Marquard (lm) y el de Regularización Bayesiana (br).
En estos
algoritmos, una vez que se conoce la salida de la RNA, se calcula el error de la
aproximación con respecto al valor deseado y se propaga hacia atrás a través de las
conexiones de la RNA actualizando los pesos de las mismas.
Generalmente, los patrones disponibles se separan en dos subconjuntos, uno de
entrenamiento y otro de validación. El subconjunto de validación ayuda a evaluar o
medir la capacidad de predicción o generalización de la RNA, por un proceso que se
denomina validación cruzada. En la validación se utilizan los patrones de datos que no
fueron utilizados durante el entrenamiento y se calcula el error de la aproximación. Con
esta información se pueden tomar medidas para evitar el sobreentrenamiento de la RNA.
En resumen, el proceso de entrenamiento sirve para que la RNA adquiera conocimiento
del comportamiento de los datos y la validación se utiliza para preservar la capacidad de
generalización del modelo. En la literatura se ofrece poca información acerca de la
selección de estos subconjuntos. Según Zhang et al. (1998), muchos autores seleccionan
éstos siguiendo una regla de 90% vs. 10%, 80% vs. 20% ó 70% vs. 30%, etc. Algunos
otros los seleccionan dependiendo de la aplicación que estén desarrollando, por ejemplo
Granger (1993) sugirió que para modelos no lineales en pronósticos al menos el 20% de
los datos deberían ser usados para validar el modelo de RNAs.
De acuerdo con Zhang (2004), las RNAs se destacan porque son modelos
matemáticos no lineales lo que las hace adecuadas para aproximar este comportamiento
en múltiples aplicaciones. Son además modelos no paramétricos que no requieren
suposiciones muy restrictivas acerca del proceso bajo el cual se están generando los
datos. Por esta razón son menos susceptibles a especificaciones erróneas de un modelo
que los métodos paramétricos. Esta característica de las RNAs es atractiva en la mayoría
Capítulo 2. Antecedentes
14
de las situaciones de pronóstico donde los datos son fáciles de obtener pero el mecanismo
de generación de los mismos no es conocido.
Ha sido matemáticamente demostrado que las RNAs poseen la capacidad de
aproximación universal de funciones continuas que tienen primera y segunda derivada en
todo su dominio. Además muchos estudios realizados demuestran que pueden aproximar
con exactitud diversos tipos de relaciones funcionales complejas (Irie and Miyake, 1988;
Hornick et al., 1989; Cybenko, 1989). Esta última característica es muy importante y
poderosa, ya que de cualquier modelo de predicción se espera que detecte con exactitud
la relación funcional entre la variable a predecir y otros factores o variables relevantes.
La combinación de modelación no lineal y aprendizaje a partir de los datos hace que
las RNA’s sean una herramienta flexible de modelación general para la realización de
pronósticos. A continuación se describen algunas de las aplicaciones de las RNAs para
pronósticos de series de tiempo.
2.2.1. Aplicaciones de las RNAs en pronósticos de series de tiempo
La idea de utilizar RNAs en pronóstico de series de tiempo data de 1964 cuando Hu
aplicó una RNA lineal adaptable de Widrow para el pronóstico del tiempo (Zhang, et al.,
1998). Debido a la ausencia de un algoritmo de entrenamiento para RNA multicapa en el
tiempo, la investigación quedó limitada. En 1974 Werbos
formuló primero la
retropropagación pero no fue conocido por los investigadores en RNAs. A partir de 1986
cuando el algoritmo de retropropagación (del inglés backpropagation) fue introducido
por Rumelhart et al., (1986) el desarrollo de RNAs para pronóstico de series de tiempo
ha ido en incremento (Zhang et al., 1998). Werbos (1988) encontró que la RNA
entrenada por retropropagación superó el desempeño de los métodos estadísticos
tradicionales tales como los procedimientos de regresión y Box- Jenkins.
En años recientes, las RNAs han llegado a ser extremadamente populares en el
pronóstico de series de tiempo, en un gran número de áreas, incluyendo finanzas,
Capítulo 2. Antecedentes
15
generación de energía, medicina, recursos del agua y ciencias ambientales, entre otras
(Maier et al., 2000).
Por ejemplo, han sido desarrollados modelos de RNAs para pronosticar la calidad
del aire (Gardner and Dorling, 1999; Kolehmainen et al., 2001; Niska et al., 2004). Por
otra parte, R.J. Kuo, et al., (1999) utilizaron datos de una cadena de supermercados de
China y encontraron que un modelo de RNA como el de la Figura 2.3, supera en gran
medida el desempeño del método estadístico autoregresivo de promedios móviles o
ARMA.
Otras aplicaciones se han concentrado en los recursos del agua, (Maier et al., 2000 ).
Por ejemplo, Ashu et al., (2001) realizaron la modelación de una RNA para el pronóstico
a corto plazo de la demanda de agua con el fin de que los sistemas que distribuyen este
vital líquido proporcionaran un servicio eficiente. Utilizaron la RNA de propagación
hacia adelante con retropropagación y utilizaron una y dos capas ocultas; los resultados
de las RNAs fueron comparados con modelos estadísticos de regresión. Observaron que
las RNAs encontraron pronósticos con mayor calidad que los modelos de regresión
empleados. Cigizoglu (2003) utilizó un modelo de RNA para pronosticar la magnitud
del flujo de un río en el este mediterráneo de Turquía, los resultados obtenidos con la
RNA fueron más precisos que los encontrados con métodos de Box-Jenkins.
En otra aplicación de los recursos del agua, Daliakopoulos et al., (2005) utilizaron
RNAs para pronosticar el nivel de agua subterránea. Analizaron datos del valle de
Messara en la parte sur de la isla de Creta en Grecia, probaron seis arquitecturas
diferentes de RNAs y variaron el algoritmo de entrenamiento así como la cantidad de
neuronas en la capa oculta. Encontraron que la RNA con mejor desempeño fue la RNA
de propagación hacia adelante con una capa oculta, entrenada mediante el algoritmo de
retropropagación de Levenberg- Marquart, utilizando 20 neuronas en la capa de entrada,
3 neuronas en la capa oculta y una en la capa de salida. Con este modelo de RNA
pronosticaron hasta 18 meses adelante. A partir del pronóstico del primer período
pronosticaron los siguientes mediante iteración del modelo.
Capítulo 2. Antecedentes
16
Gutiérrez-Estrada et al., (2004) realizaron una comparación de un modelo de RNA
contra métodos estadísticos tradicionales tales como regresión múltiple, suavizado
exponencial y ARIMA, en el pronóstico de la concentración de Amonio, utilizaron datos
de un criadero de peces (del inglés fishfarm) del sur de España. Probaron un modelo de
RNA parecido al de la Figura 2.3, sólo que con dos capas ocultas. En promedio, la RNA
realizó mejores predicciones que los métodos convencionales. Preprocesaron la
información de la siguiente manera: utilizaron como datos las diferencias existentes
entre períodos adyacentes y posteriormente, transformaron esas diferencias a la escala
[0, 1]. El pronóstico fue de un solo período.
En el área de finanzas, Qing et al., (2005) utilizaron RNAs para pronosticar el
comportamiento de la bolsa de valores; los resultados que obtuvieron mostraron que las
RNAs son una buena herramienta para pronosticar el precio de las acciones en mercados
emergentes como China. Otro trabajo desarrollado en esta área es el desarrollado por
West et al., (2005).
Otra área de aplicación de las RNAs es en la predicción de demanda de algún
producto o servicio. En los últimos años se ha reportado que las RNAs en la predicción
de carga eléctrica han demostrado ser una de las técnicas más exitosas en esta área.
González et al., (2005) pronosticaron el consumo de energía/hora en edificios.
Correlacionaron las condiciones climáticas, los días y horarios, con las variaciones de
carga, para predecir la carga y el consumo total en cada hora. Utilizaron una RNA de
avance con tres capas y manejaron los datos en diferencias en la escala [-0.9, 0.9]. La
calidad de los resultados obtenidos con el modelo de RNA fueron muy precisos, de
acuerdo con su reporte.
Sözen, et al., (2005) desarrollaron un modelo de RNA para pronosticar la radiación
solar en Turquía, compararon los resultados con los que otros autores habían encontrado
al utilizar métodos estadísticos de descomposición clásica. Su estudio confirmó que el
modelo de RNA pronostica los valores de la radiación solar de manera más precisa que
los métodos utilizados en estudios anteriores.
Capítulo 2. Antecedentes
17
Estudios recientes acerca de la aplicación de RNAs en problemas de investigación de
operaciones y negocios, incluyendo pronóstico en finanzas, se pueden encontrar en
Zhang (2004) y Smith et al., (2000).
En las aplicaciones mencionadas anteriormente, hacen uso de RNAs multicapa
entrenadas por retropropagación del error para pronósticos a corto plazo y se limitan a
utilizar RNAs con una sola neurona en la capa de salida. Sin embargo, en aplicaciones
prácticas es común que se desee estimar más de un período futuro, este tipo de pronóstico
se caracteriza por la incertidumbre causada por la distancia u horizonte de tiempo
utilizado.
Cuando se desea pronosticar múltiples períodos, muchos investigadores (Zhang et al.,
1998; Hwarng, 2001; Hill et al., 1996; Nelson et al., 1999) han utilizado como recurso un
modelo de RNA con una neurona en la capa de salida, como en los casos anteriores. Esta
RNA se ha utilizado como base para generar pronósticos de múltiples períodos de la
manera siguiente: una vez que tiene el pronóstico para el primer período, se itera el
modelo considerando a éste como dato real para calcular el pronóstico del segundo
periodo, y así sucesivamente hasta alcanzar el horizonte de planeación deseado. Esta
técnica obviamente trae consigo la desventaja de propagar el error de cada uno de los
pronósticos a lo largo de todos los períodos que le siguen. Esto es, si en el pronóstico del
primer período se tuvo un error grande, éste afectará el pronóstico del segundo período y
éste a su vez el del tercero y así sucesivamente. En otras palabras, un mal pronóstico
generado en los primeros períodos podría afectar de manera adversa los pronósticos de
los últimos períodos.
Una técnica utilizada por Duhoux et al., (2001) es utilizar cadenas de RNAs. Esta
técnica consiste en utilizar n RNAs simples, con diferentes tamaños del vector de
entradas que van desde 1 hasta n. La entrada de una RNA será la misma que la entrada de
la RNA anterior más el valor pronosticado por la RNA anterior. Las desventajas que
reportaron en cuanto al uso de este método son que: 1) El modelo requiere un número
muy grande de RNAs y de datos y 2) el conocimiento adquirido en un modelo de RNA
no es usado para la construcción del siguiente modelo.
Capítulo 2. Antecedentes
18
Otra técnica comúnmente utilizada para el pronóstico de múltiples períodos es la
creación de RNAs independientes para cada horizonte de pronóstico deseado, es decir, se
crean modelos de RNAs independientes, uno para pronosticar el valor de la serie en el
primer período, otro para pronosticar el del segundo período, otro para el pronóstico del
tercero, y así para cada uno de los períodos. Este método tiene la ventaja de no propagar
el error de cada pronóstico hacia los que le siguen, sin embargo se tendrían varios
modelos independientes, desarrollados y seleccionados de manera diferente, dependiendo
del horizonte de pronóstico. Hanh et al., (2004) utilizan esta técnica para pronóstico de
series de tiempo con horizonte de planeación largo, utilizando series de tiempo de la
demanda de gas en una estación compresora en Saskatchewan, Canadá. Los resultados
obtenidos fueron comparados contra un modelo iterativo y observaron que crear
múltiples RNAs, una para cada horizonte de planeación resultó con mejor aproximación
que utilizar un modelo simple en el que consideran como dato real el pronóstico
calculado en el o los períodos anteriores.
Una técnica más de RNAs para el pronóstico de múltiples períodos es crear un solo
modelo que simultáneamente genere los pronósticos de múltiples períodos, es decir, una
RNA con múltiples salidas. Este método, se espera que conduzca a mejores resultados
(Zhang, 2004) que las técnicas descritas anteriormente, sin embargo, aún no está
teóricamente demostrado. Tenemos poco conocimiento de trabajos desarrollados con la
aplicación de esta técnica.
A pesar de que son numerosas las aplicaciones desarrolladas mediante RNAs para
pronóstico de series de tiempo y que los resultados han sido satisfactorios, no ha sido
posible estandarizar una metodología que garantice la construcción de modelos de RNAs
con buen desempeño. El desempeño de la RNA está determinado por la exactitud del
pronóstico y ésta depende de varias decisiones sumamente importantes en cuanto a la
definición de los parámetros que intervienen en el modelo. Estas decisiones se discuten a
continuación.
Capítulo 2. Antecedentes
19
2.2.2 Decisiones en la aplicación de RNAs para pronósticos de series de
tiempo
Dentro de las decisiones críticas en la construcción de una RNA multicapa (ver Figura
2.3) para pronósticos de series de tiempo se encuentran la especificación de la
arquitectura en términos de la cantidad de variables de entrada (el número de neuronas en
la capa de entrada), así como el número de neuronas en la capa oculta y en la capa de
salida (Qi et al, 2001).
Al determinar el número de neuronas en la capa de entrada, se determina la cantidad
de datos históricos que se deben utilizar para la realización del pronóstico. En este
documento, a los datos históricos se les denominará con el término en inglés lags. Así
mismo, es bien sabido que el número de neuronas en la capa oculta determina la
capacidad de la RNA para aproximar las relaciones no lineales entre los lags y las
variables de salida o pronósticos (Zhang et al., 1998). La selección de número de
neuronas en la capa oculta ha sido anteriormente estudiada por diversos autores (Zhang,
2004; Hansen et al., 2003; Sexton et al., 2005), sin embargo, no existe aún una manera
definitiva para abordar este problema.
Otra decisión implica determinar si se
preprocesan los datos o no. Son numerosas las aplicaciones de RNAs en las que los
autores aconsejan el preprocesamiento de los datos para mejorar el desempeño de la
RNA. Por ejemplo, Piramuthu et al. (1998) documentan la importancia del mismo. Se ha
observado que al construir nuevas representaciones de los datos se pueden atenuar las
dificultades durante la fase de entrenamiento, en la que la RNA trata de aprender
(representar) los datos que se le presentan. El preprocesamiento reduce el grado de
dispersión y complejidad de los datos en el espacio de búsqueda bajo el cual se lleva a
cabo el entrenamiento (Hansen et al., 2003) y es por tanto un factor importante si se
busca mejorar el desempeño de la RNA.
Por otra parte, seleccionar el algoritmo de entrenamiento que se utilizará para
modificar los pesos de las conexiones de la RNA es otro factor importante para la gran
mayoría de aplicaciones de RNAs. Pronósticos de series de tiempo en este caso, no es la
excepción.
Capítulo 2. Antecedentes
20
Para la selección de los parámetros que intervienen en el modelo de RNA, algunos
autores utilizan prueba y error; otros más han utilizado algoritmos genéticos o
procedimientos híbridos, sin embargo existe poca información y evidencia acerca de la
efectividad de los mismos. Por ejemplo, Liao et al., (2005) proponen un procedimiento
para la selección de parámetros de la RNA que consiste en tres etapas, en cada una de
ellas fijan algunos de los parámetros y utilizan un diseño de experimentos. La desventaja
en este método es que en cada etapa se ajusta uno de los parámetros, es decir, el ajuste se
realiza de manera independiente ignorando por completo la posible interacción entre los
diferentes parámetros del modelo.
En este trabajo se propone que la selección de los parámetros de RNA para pronóstico
de series de tiempo se realice de una manera sistemática y consistente por medio de la
utilización de métodos estadísticos experimentales y técnicas de optimización siguiendo
la metodología que se describe en el siguiente capítulo. La información relevante en
cuanto al diseño de experimentos se presenta a continuación.
2.3. Análisis y Diseño de Experimentos
El Diseño y Análisis de Experimentos (ADE) es una colección de herramientas
estadísticas que se relacionan con la planeación, la ejecución y la interpretación de un
experimento. Tiene como objeto estudiar los efectos de variables de interés dispuestas en
varios niveles en una o varias respuestas cuantificables. Sir Ronald A. Fisher introdujo
los principios básicos de ADE en las décadas de 1920 y 1930 en el área agrícola
(Montgomery 2004; Martínez 1988).
De manera general, un experimento se puede definir como una prueba planeada donde
se introducen cambios controlados en las variables de entrada de un proceso o sistema
con el objetivo de analizar la variación inducida por estos cambios en una repuesta o
salida (Montgomery, 2004). Un proceso o sistema puede ser visto como el modelo
representado en la Figura 2.4.
Capítulo 2. Antecedentes
21
El diseño de experimentos se ha aplicado en diversas disciplinas, puede considerarse
como parte del conocimiento científico y es uno de los medios más utilizados para
conocer el funcionamiento de procesos y sistemas. En general, un proceso puede ser
visto como una combinación de máquinas, métodos, personas u otros recursos que
transforman ciertas entradas (con frecuencia un material) en una salida que tiene una o
más respuestas observables. Algunas variables son controlables, mientras que otras no lo
son.
Factores Controlables
x1
x 2 ...
x n −1
xn
PROCESO
Entradas
z1
z 2 ...
z m −1
Salidas, y
zm
Factores no Controlables
Figura 2.4: Modelo general de un proceso o sistema.
Cuando se planea o ejecuta un experimento es siempre recomendable usar el
conocimiento
no-estadístico
del
sistema
para
complementar
el
proceso
de
experimentación, así como para mantener el tamaño y la concentración del experimento
dentro de límites adecuados. En muchos experimentos interviene el estudio de los
efectos de dos o más factores, en general los diseños factoriales son muy recomendables
para este tipo de análisis.
Capítulo 2. Antecedentes
22
El diseño factorial es una estrategia de experimentación en la que en cada réplica del
experimento se estudian todas las combinaciones posibles de un número determinado de
valores de cada factor. Al número determinado de valores que toma cada factor se les
llama niveles. Por ejemplo, si tenemos el factor A y el factor B, cada uno con dos
niveles, cada réplica experimental contiene 22 combinaciones, a cada nivel le
corresponde un valor específico del factor.
El efecto de un factor se define como el cambio en la respuesta o medida de
desempeño producido por un cambio en el nivel del factor. En algunos experimentos
puede encontrarse que la diferencia en la respuesta entre los niveles de un factor no es la
misma para todos los niveles de otro factor, a esto se le llama interacción entre factores.
Cuando los factores del diseño de experimentos son cuantitativos, una representación
del experimento se puede realizar mediante un modelo de regresión en el que las
variables independientes representan los factores del experimento, la variable
dependiente corresponde a la medida de desempeño o respuesta y la estimación de los
parámetros del modelo de regresión están relacionados con la estimación de los efectos
de los factores en la medida de desempeño. Para la estimación de parámetros
generalmente se utiliza el método de mínimos cuadrados. Información más completa
acerca del análisis y diseño de experimentos se puede encontrar en Montgomery (2004).
Se puede utilizar el análisis y diseño de experimentos para caracterizar la variación de
un sistema y para obtener modelos empíricos como la regresión descrita anteriormente.
Estos modelos pueden después utilizarse para llevar a cabo la optimización. En la
siguiente sección se abordan aspectos básicos del área de optimización.
2.4. Optimización
En la gran mayoría de aplicaciones prácticas en la ciencia y la ingeniería se emplean
modelos matemáticos para representar un sistema o proceso de interés con el fin de
estudiar y entender el funcionamiento del mismo. Podemos decir que un modelo es un
Capítulo 2. Antecedentes
23
conjunto de relaciones matemáticas que representan una abstracción del sistema real en
consideración.
De acuerdo con Floudas (1995), un modelo matemático consta de tres elementos
clave: variables, parámetros y restricciones o relaciones matemáticas. Las variables
pueden tomar diferentes valores y sus especificaciones determinan diferentes estados del
sistema. Representan las decisiones que se pueden tomar para afectar el rendimiento del
sistema, por ejemplo, la cantidad de producto a fabricar o vender, la cantidad de materia
prima, etc. Estas pueden ser continuas, enteras o mixtas (combinación de continuas y
enteras). Los parámetros se fijan a valores específicos y cada especificación determina un
modelo diferente. Las relaciones matemáticas pueden ser clasificadas en igualdades,
desigualdades y condiciones lógicas. Usualmente las igualdades son utilizadas para
representar los balances de masa y energía; relaciones de equilibrio, cálculos de
propiedades físicas y relaciones de diseño que describen el sistema físico. Las
desigualdades generalmente representan la asignación de recursos, los límites de
capacidad disponible y demanda. Mientras que las condiciones lógicas proveen las
conexiones de este tipo entre las variables continuas y las variables enteras. Las
relaciones matemáticas pueden ser algebraicas, transcendentes, o una mezcla de
algebraicas y trascendentes; pueden ser lineales o no lineales. Una relación es
trascendente cuando contiene expresiones trigonométricas, exponenciales o logarítmicas.
Un problema de optimización, además de tener las características de un modelo
matemático, cuenta con uno o múltiples criterios que representan el desempeño del
sistema o proceso. El criterio de desempeño denota la función objetivo del problema de
optimización. La función objetivo representa una medida de desempeño cuantificable
que se quiere ya sea maximizar o minimizar. Por ejemplo, en general los costos
representan una medida de desempeño que se desea minimizar y las ganancias una
medida que se quiere maximizar.
La formulación (2.1) es la representación general de un problema de minimización.
Capítulo 2. Antecedentes
24
min f(x)
s.a
h(x) = 0
(2.1)
g(x) ≤ 0
x ∈ X ⊆ ℜn
Si cualquiera de las funciones f ( x), h( x), g(x) es no lineal, entonces la formulación
(2.1) es llamada problema de optimización no lineal. Las funciones f ( x), h( x), g(x)
pueden tomar cualquier forma de no linealidad.
Este tipo de problemas abundan en un
gran número de aplicaciones en diversas áreas tales como diseño y control de procesos
químicos, localización de facilidades, diseño de redes, diseño de circuitos electrónicos
entre otras.
Una vez que se tiene el problema de optimización se procede a resolverlo con el fin de
encontrar la mejor solución que cumpla con el conjunto de restricciones. Al conjunto de
soluciones que cumplen con el conjunto de restricciones se les conoce como soluciones
factibles y la mejor de ellas es conocida como solución óptima. Lo deseable es encontrar
la solución óptima, sin embargo muchas veces esto no es posible dadas las características
de los problemas. Estas características en general tienen que ver con convexidad.
Se dice que un conjunto S ∈ E
n
es un conjunto convexo si para cualesquiera dos
puntos x 1 , x 2 ∈ S se satisface que λ x 1 + ( 1 − λ ) x 2 ∈ S para cada λ ∈ [ 0 ,1 ] .
Ahora bien, sea
S
un conjunto convexo, se dice que f ( x ) es convexa si y sólo si
se satisface (2.2) para cualquier x 1 , x 2 ∈ S y
0 ≤ λ ≤ 1
.
f [( 1 − λ ) x 1 + λ x 2 ] ≤ (1 − λ ) f ( x 1 ) + λ f ( x 2 )
(2.2)
Capítulo 2. Antecedentes
25
En la Figura 2.5, podemos observar gráficamente lo que sería a) una función convexa;
b) una función estrictamente convexa y en la Figura 2.6 se representa una función no
convexa.
b)
a)
Figura 2.5: a) Función convexa y b) Función estrictamente convexa.
Figura 2.6: Función no convexa.
Capítulo 2. Antecedentes
26
Más aún, decimos que
f ( x ) es estrictamente convexa si y sólo si se cumple
estrictamente el sentido de la desigualdad (2.2) para todo
x1 , x
2
∈ S tal
que x 1 ≠ x 2 y 0 < λ < 1 .
Si x
*
∈ S y satisface (2.3) ∀ x ∈ S , decimos que x
*
es un mínimo
global.
f (x*) ≤
Si
x
*
f (x)
∈ S y existe un entorno V ( x
∀ x ∈ S ∩ V (x
*
) , se dice que x
*
*
(2.3)
) tal que se satisface (2.3)
es un mínimo local.
La función f ( x ) estrictamente convexa tiene a lo más una solución óptima, lo cual
garantiza optimalidad global (Borwein, et al., 2000; Floudas, 1995).
Nótese que, si
f ( x ) es convexa podemos encontrar rápidamente una solución
óptima global, pero si no lo es, es posible tener varias soluciones óptimas locales. Estas
provocan que los métodos utilizados para resolver el problema se queden atrapados en
ellas reduciendo la posibilidad de encontrar una solución óptima global.
Existen varias referencias de consulta para el área de optimización, dentro de las que
se encuentran Borwein et al., (2000), Floudas (1995) y Luenberger (1973).
Cuando se tienen múltiples criterios en un problema de optimización, el problema se
clasifica como de optimización multicriterio. En la práctica es muy común la existencia
de este tipo de problemas. Por ejemplo, en muchas empresas se pretende maximizar la
calidad de un producto y minimizar su costo de producción simultáneamente. Ésto
implica un conflicto. Existen diversas técnicas que se han desarrollado con el fin de
resolver este tipo de problemas.
Capítulo 2. Antecedentes
27
Las técnicas de optimización multicriterio tienen como objetivo encontrar aquellas
soluciones que representen los mejores compromisos entre todas las medidas de
desempeño, las cuales se denominan soluciones eficientes. Una representación gráfica
Objetivo 2. Maximizar
conveniente se puede encontrar en la Figura 2.7.
Objetivo 1. Minimizar
Figura 2.7: Representación Gráfica de un Problema de Optimización Multicriterio. La
línea mostrada une soluciones eficientes y delimita la frontera eficiente del problema.
Dado que no es el objetivo en este trabajo discutir a fondo técnicas multicriterio, se
refiere al lector interesado a Deb (2004) y a Hillermeier (2001) para ahondar en el tema.
Una de las técnicas que se ha propuesto recientemente para resolver este tipo de
problemas es el análisis envolvente de datos. Algunas aplicaciones en el terreno de la
manufactura se pueden encontrar en Cabrera-Ríos et al. (2002,2004), Castro J. M. et al.
(2004) y en Castro C. E et al. (2003).
CAPÍTULO 3
METODOLOGÍA PROPUESTA
Introducción
Desarrollar un modelo de RNAs para una aplicación particular de pronóstico no es
una tarea trivial. Aunque en la actualidad existen herramientas computacionales que
ofrecen a los usuarios la construcción de modelos de RNAs de una manera fácil y
rápida, continúa siendo un reto la comprensión de muchos factores que determinan la
efectividad de un modelo de RNAs. Zhang (2004) llega a afirmar que la construcción de
una RNA efectiva es una combinación de arte y ciencia.
En este capítulo, se propone una metodología basada en el análisis estadístico y
optimización de las medidas de desempeño de la RNA, que son esencialmente definidas
para nuestros propósitos como medidas del error de predicción. El método consiste en
diseñar y analizar un experimento estadístico en el que cada factor o variable controlable
corresponde a uno de los parámetros que se desea ajustar en la RNA. Se caracterizan los
resultados mediante un análisis de varianza basado en un modelo de regresión apropiado
para cada medida de desempeño. Posteriormente, se considera cada uno de los modelos
de regresión como la función objetivo de un problema de optimización en el que se
28
Capítulo 3. Metodología Propuesta
29
busca el valor de los parámetros que minimizan el valor objetivo de la medida de
desempeño. La solución final determina el valor que deben tomar los parámetros para
que el modelo de RNAs encuentre pronósticos confiables.
3.1 Descripción de la Metodología
La Figura 3.1 representa esquemáticamente la metodología que se propone con el
objetivo de seleccionar los parámetros del modelo de RNAs de una manera sistemática y
consistente. La metodología aquí se presenta de una manera general para RNAs. En los
capítulos posteriores se discutirán los detalles de su aplicación en pronósticos de series
de tiempo. Dentro de las características atractivas de la metodología se encuentra que:
(1) utiliza técnicas establecidas y confiables, (2) puede instaurarse sin necesidad de una
codificación especializada y (3) hace entendible la interrelación entre los varios
parámetros de la RNA.
Esta metodología surgió con la idea básica de ver la RNA como un sistema en el cual
existen variables controlables que influyen en una de sus medidas de desempeño. De
esta forma, al considerar los parámetros de la RNA como variables controlables que
influyen en el desempeño de la misma, podemos variar estos parámetros para formar la
superficie de respuesta del error de predicción de la RNA y así construir un modelo de
regresión que relacione parámetros y error de predicción. Con este conocimiento es
posible, en caso que sea necesario, eliminar variables que no sean estadísticamente
significativas, caracterizar interacciones, así como determinar si las medidas de
desempeño seleccionadas acerca de la RNA dependen de conjuntos de variables
distintos entre sí. En este último caso, es factible crear problemas independientes de
optimización para distintas medidas de desempeño.
Capítulo 3. Metodología Propuesta
30
Parámetros
Tipo de RNA
1) Descripción de la RNA
como Sistema.
Respuestas
2) Análisis y Diseño de
Experimentos.
Caracterización
3) Metamodelación
4) Problemas de
Optimización.
Múltiples
Inicializaciones
5) Solución
Figura 3.1: Metodología Propuesta para la Selección de Parámetros en RNAs.
Dado que nuestro objetivo final es determinar qué valores deben tomar los
parámetros para obtener un valor deseable en las medidas de desempeño de la RNA, el
problema se convierte en uno de optimización.
Capítulo 3. Metodología Propuesta
31
Los pasos de la metodología propuesta en la Figura 3.1 se pueden describir de la manera
siguiente:
1) Descripción de la RNA como Sistema.
Determinación del tipo de RNA que se utilizará para el análisis.
El tipo de RNA está determinado por la manera en que se interconectan las neuronas
en la red, suele conocerse con el nombre de topología o arquitectura de la RNA. Existe
una diversidad impresionante de arquitecturas de RNAs, que han sido desarrolladas,
estudiadas y utilizadas en diversas aplicaciones. Las RNAs más comunes son las redes
por capas, las redes recurrentes y las redes de conexión lateral (Ghaziri, 1996). En el
caso de RNAs para pronósticos de series de tiempo, la más utilizada es la RNA
multicapa, representada en la Figura 2.3.
Identificación de los parámetros controlables.
Una vez que se ha seleccionado el tipo de RNA que se utilizará para la aplicación, es
necesario identificar aquellos parámetros que afectan el desempeño de la RNA con el fin
de asignarles un valor que permita la obtención de una RNA confiable.
Definición de las respuestas de interés (medidas de desempeño de la RNA).
Las respuestas de interés o medidas de desempeño de la RNA suelen ser medidas que
cuantifican el error de aproximación. Las más comunes son el Error Absoluto Medio o
MAE y el Error Cuadrado Medio o MSE. La aplicación y los intereses del usuario
determinan la selección de la medida de desempeño.
Capítulo 3. Metodología Propuesta
32
2) Análisis y Diseño de Experimentos.
Para llegar a la definición de la metodología propuesta de la Figura 3.1, se partió del
hecho de que un experimento puede ser visto como una prueba planeada donde se
introducen cambios controlados en un proceso o un sistema con el objetivo de analizar la
variación inducida por estos cambios en una medida de desempeño.
En varios casos y dada la rapidez relativa con la que se pueden entrenar las redes
neuronales, será factible escoger un diseño factorial. Este diseño contiene tantas corridas
experimentales como combinaciones de niveles resulten para los factores, esto es, si
existen cuatro factores variados a tres, cuatro, tres y cinco niveles cada uno, el diseño
factorial tendrá 3x4x3x5 = 180 corridas experimentales. De esta manera, los factores
controlables que intervienen en el experimento corresponden a los parámetros del
modelo de RNA que se desean determinar. Cada corrida experimental indica los valores
asignados a los parámetros para construir la RNA correspondiente y bajo los cuales se
llevará a cabo el entrenamiento y validación de la misma. Una vez realizado el
entrenamiento, se cuantifica la calidad de predicción de la RNA a través de las medidas
de desempeño seleccionadas para el estudio y se registra como parte del experimento.
En los parámetros donde sea posible considerar tres o más valores diferentes, es
recomendable utilizar al menos tres de esos valores, con el fin de estimar curvatura.
Con el objetivo de caracterizar la variación producida por los parámetros en las
medidas de desempeño del modelo de RNA, requerimos hacer un análisis de varianza
basado en un modelo de regresión lineal múltiple de segundo orden con interacción,
similar al de la Ecuación (3.1), bajo el supuesto de que los residuos ε , son
independientes e idéntica y normalmente distribuidos con una varianza desconocida pero
constante.
Capítulo 3. Metodología Propuesta
33
3) Metamodelación.
En esta fase se describe la superficie de cada respuesta (medida de desempeño)
mediante un modelo de regresión apropiado, sin dejar a un lado la comprobación de los
supuestos descritos anteriormente. La formulación del modelo de regresión utilizado es
la siguiente:
k
k
i =1
i =1
k −1
y = β 0 + ∑ β i x i + ∑ β ii x i + ∑
2
k
∑β
i =1 j = i +1
ij
xi x j + ε
(3.1)
La variable dependiente y representa el valor de la medida de desempeño de la
RNA, xi corresponde al valor que toma el parámetro i en cada combinación factorial,
β0
representa la ordenada al origen del plano de regresión, β i corresponde al
coeficiente de regresión de xi , β ii es el coeficiente de regresión de xi2 y β ij es el
coeficiente de regresión de la interacción de entre xi y x j , ∀(i < j ) ; k es el número de
parámetros controlables.
Los coeficientes de regresión son típicamente calculados mediante un procedimiento
de reducción de errores cuadrados, disponible en la mayoría de paquetes
computacionales de estadística comerciales. A este procedimiento suele llamársele
“ajuste del modelo”. Una vez calculados los coeficientes de regresión se realiza la
comprobación de supuestos para verificar la adecuación del modelo.
A través del análisis de residuos se comprueba la independencia estadística, la
normalidad y la varianza constante en los residuos. Entiéndase como residuo, la
diferencia que existe entre el valor de la medida de desempeño obtenida en la
experimentación y el valor que se obtiene mediante el modelo de regresión en cada una
de las combinaciones factoriales. El análisis de residuos se puede llevar a cabo
Capítulo 3. Metodología Propuesta
34
inicialmente a través de una serie de gráficas. Si se detecta algún problema en esta fase,
entonces se utilizan pruebas formales estadísticas de hipótesis para comprobar las
conclusiones.
4) Problemas de Optimización.
Para llevar a cabo la optimización, los metamodelos (modelos de regresión)
obtenidos en la fase anterior se usan aquí como funciones objetivo de un problema de
optimización. Se construye un problema de optimización para cada medida de
desempeño.
Como se muestra en la formulación (3.2), la función objetivo z estará definida por el
metamodelo que se encontró para la correspondiente medida de desempeño y el objetivo
final será encontrar los valores de los parámetros que minimizan el valor de la función
objetivo. En general, los problemas de optimización resultantes tienen la formulación
3.2.
∀i∈ I
Encontrar
xi
Minimizar
z = β0 +
Sujeto
k
∑
i =1
para
β i xi +
k
∑
i =1
β ii x i 2 +
k −1
k
i =1
j = i +1
∑ ∑
β ij x i x j
(3.2)
a
x li ≤ x i ≤ x ui
xi ∈ Z
+
∀i∈ I
∀i∈ I
I = {1 , 2 ,..., k }
Las variables de decisión son las variables xi , representan el i-ésimo parámetro que
se busca para minimizar la función objetivo z . Como ya se mencionó anteriormente, la
función objetivo corresponde al modelo de regresión que describe la medida de
desempeño en cuestión; k es el número de parámetros controlables, dichos parámetros
están acotados por un valor mínimo x li y un valor máximo xui que deben ser
Capítulo 3. Metodología Propuesta
35
especificados con anterioridad en la fase de Análisis y Diseño de Experimentos. La
última restricción indica que las variables xi pueden tomar solamente valores enteros y
positivos.
5) Solución
Esta fase consiste en resolver los problemas de optimización definidos en el paso
anterior mediante el uso de algún optimizador. El problema de optimización (ver
formulación 3.2), para cada medida de desempeño es no lineal la gran mayoría de las
veces y las variables de optimización xi son enteras. Estas características hacen que el
problema de optimización sea difícil de resolver. Más aún, estos problemas suelen ser no
convexos, en cuyo caso no se puede garantizar que la solución final sea una solución
óptima global.
Un problema no convexo, nos lleva a la presencia de múltiples soluciones que son
óptimas localmente, así que se corre el riesgo de estancarse en la peor de ellas y tomarla
como solución final debido a que un optimizador local no pudo encontrar una mejor
solución que ésta. Con el propósito de evitar lo anterior, se parte de múltiples soluciones
iniciales para resolver el problema, se registran cada una de las soluciones encontradas y
al final se selecciona la mejor de ellas para entregarla como solución final.
Una vez que se han resuelto los problemas de optimización de manera independiente,
se analizan las soluciones encontradas por el optimizador. Si la solución final es la
misma para todos los problemas, significa que las medidas de desempeño están
correlacionadas pues lo que minimiza a una también minimiza a las otras.
En caso que las soluciones finales encontradas para cada uno de los problemas de
optimización sean diferentes, se implementa una técnica de optimización multicriterio
para dar un abanico de soluciones que represente el mejor compromiso en las medidas
de desempeño de la RNA. A estas soluciones se les llama “eficientes”. De este conjunto
de soluciones, el usuario elige una.
Capítulo 3. Metodología Propuesta
36
Cuando se sigue esta metodología, la solución final a la que se llega indica en qué
valores deben colocarse los parámetros de la RNA para que ésta garantice la obtención
de pronósticos confiables con bases estadísticas sólidas.
Se probó inicialmente la metodología aquí descrita en el estudio de un caso práctico
de pronóstico de demanda de un solo período en la industria de telecomunicaciones, este
caso se describe en el Capítulo 4. En el Capítulo 5 se explica a detalle el diseño de una
RNA de múltiples períodos siguiendo esta misma metodología.
CAPÍTULO 4
PRONÓSTICO DE SERIES DE
TIEMPO DE UN SOLO PERÍODO
Introducción
Los pronósticos de series de tiempo constituyen un área activa para la aplicación de
Redes Neuronales Artificiales (RNAs). Aunque la selección de una RNA para tal
aplicación se ha simplificado grandemente, la falta de un método establecido para
asignar los parámetros de las RNAs de una manera adecuada sigue siendo un reto.
En el Capítulo 3 se propuso una metodología basada en técnicas estadísticas y
optimización para la selección de parámetros de una RNA. La comprobación de esa
metodología se realizó al aplicarla en el desarrollo de un modelo de RNA para
pronóstico de demanda en telecomunicaciones. Este modelo se construyó tomando como
base la RNA presentada en la Figura 2.3 por su bien conocida capacidad de
aproximación universal (White, 1990; Hornik, 1989), su amplia utilización y el buen
desempeño que ha mostrado en el análisis de series de tiempo (Zhang, et al., 1998;
Zhang, 2004; Liao et al., 2005; Hansen, et al., 2004).
37
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
38
En el presente Capítulo se describe la aplicación de la metodología descrita en el
Capítulo 3. En la Sección 4.1 se da una descripción detallada del problema en la
industria de telecomunicaciones, la Sección 4.2 contiene la ejecución de la metodología
para la selección de los parámetros del modelo de RNA explicada paso a paso así como
los resultados obtenidos. Finalmente, se muestran las conclusiones del Capítulo.
4.1. Pronóstico de Demanda en telecomunicaciones
En la empresa de este caso, se tiene la necesidad de estimar el comportamiento de la
demanda para el siguiente período con el fin de prever la capacidad necesaria en la red
de transmisión que permita la satisfacción total de la demanda. La capacidad requerida
en la red de transmisión está directamente relacionada con la utilización de ésta a lo
largo del tiempo. Podemos decir entonces que en nuestro caso, la variable de interés es
la demanda de un servicio, que implica la utilización de la red de transmisión.
La empresa cuenta con equipo especializado que lleva un registro de la cantidad de
tráfico que pasa a través de cada nodo de la red de transmisión. Los registros de la
utilización de la red se realizan mensualmente, por tanto contamos con información
histórica o serie de tiempo del comportamiento de la demanda. Tal comportamiento se
muestra en la serie de tiempo de la Figura 4.1.
Una vez que se tiene la serie de tiempo, se procede al análisis de la misma con el fin
de construir un modelo que aproxime el comportamiento de la demanda con exactitud y
de esa manera nos permita pronosticar de manera confiable el valor de la demanda en
períodos posteriores.
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
39
800
Unidades de Demanda
700
600
500
400
300
200
100
0
1
7
13
19
25
31
37
43
49
55
61
67
Tiempo (meses)
Figura 4.1: Serie de tiempo del comportamiento de la demanda.
Como se mencionó anteriormente, existen diversas metodologías que nos permiten
llevar a cabo el análisis de series de tiempo, sin embargo, la gran mayoría son métodos
lineales. Como se verá en el Capítulo 6, tales métodos no son los más adecuados para
nuestro caso debido a la presencia de no linealidad.
Las relaciones no lineales en los datos se encuentran en varias aplicaciones prácticas
y es por tanto necesario utilizar técnicas capaces de reflejar tal comportamiento. Las
RNAs proveen una herramienta alternativa para la realización del análisis y pronóstico
debido a su capacidad de modelar esta no linealidad. Por otro lado, incluso cuando el
caso es uno de linealidad, las RNAs han mostrado ser exitosas y competitivas como
herramientas de modelación (Hwarng, 2001; Medeiros et al., 2001; Zhang, 2001). Por
esta razón, optamos por desarrollar un modelo de RNA para pronósticos de series de
tiempo. A continuación se describe la construcción del modelo.
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
40
4.2. Construcción del Modelo de RNA para Pronóstico de
Series de Tiempo de un solo período
Teniendo como principal objetivo comprobar la metodología descrita en el Capítulo
3, consideramos la serie de tiempo de la Figura 4.1 con el fin de desarrollar un modelo
de RNA como el de la Figura 4.2 para predecir el valor de la demanda del siguiente
período.
4.2.1. Descripción de la RNA como Sistema
Determinación del tipo de RNA que se utilizó para el análisis.
Para la construcción del modelo se utilizó la RNA representada en la Figura 4.2. Ésta
es una red neuronal similar a la mostrada en la Figura 2.3, con la excepción de que en
este caso es para un modelo de pronósticos. Cuenta con tres capas de neuronas: una capa
de entrada en la que se recogen datos conocidos, una capa oculta que determina la
flexibilidad de la RNA para adaptarse a los datos conocidos y una capa de salida, por
medio de la que se obtiene la salida de la red, es decir el valor del pronóstico. En esta
RNA específica, se considera solamente una neurona en la capa de salida, la variable
neuronas determina la cantidad de neuronas en la capa oculta y la cantidad de datos
históricos (lags) determina la cantidad de neuronas en la capa de entrada.
En la Figura 4.2, las entradas Yi
para i = t − m, t − m + 1,...t presentadas a la RNA,
corresponden a los valores de la demanda registrada en m períodos anteriores (lags) al
período t + 1 . Estas son propagadas hacia delante a través de las capas y el vector de
salida de cada neurona es calculado mediante la función de transferencia, este función
debe ser continua, diferenciable y acotada. En nuestro caso, las funciones de
transferencia utilizadas fueron la tangente hiperbólica (Ecuación 4.2) en las neuronas
de la capa oculta y la función identidad (Ecuación 4.3) en la neurona de la capa de
salida (que en este caso es una neurona). De esta manera, el patrón de entrenamiento o
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
41
bien de validación está formado por un conjunto de datos históricos (lags) que llevan
asociado un valor futuro deseado (target).
∧
Capa de
Salida
Y t +1
bt+1
Vt+1,i
Capa Oculta
………
bj
Wji
Capa de
Entrada
…...
Yt
Yt-1
Yt-m+1
Yt-m
Figura 4.2: Red Neuronal Artificial de propagación hacia adelante, entrenada por
retropropagación del error de pronóstico, con tres capas.
En
W ji
la
mostrada
para i = 1,2,..., neuronas ,
conexión
Vt +1,i
RNA
que
llega
a
la
para j = 1,2,..., m
neurona
j
la
Figura
corresponde
procedente
de
al
la
peso
neurona
4.2,
de
la
i
,
para i = 1,2,..., neuronas es el peso de la conexión que llega a la neurona t + 1
(neurona de salida) desde la neurona
bj
en
como
j (neurona de la capa oculta). Tanto
bt +1 son conocidos como umbrales (del inglés ‘biases’), y representan el
umbral de la neurona j (en la capa oculta) y el umbral de la neurona t + 1 en la capa de
salida respectivamente.
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
42
La neurona en la capa de salida calcula el pronóstico de la demanda en el período
∧
t + 1 y está representado por Y t +1 . La representación matemática de la RNA es la descrita
en la Ecuación (4.1).
∧
⎡m ⎛
⎤
⎛ neuronas
⎞⎞
Y t +1 = g ⎢∑ ⎜⎜Vtj × f ⎜ ∑ W jiYi + b j ⎟ ⎟⎟ + bt +1 ⎥
⎢⎣ j =1 ⎝
⎥⎦
⎝ i =1
⎠⎠
(4.1)
Donde:
e x + e −x
f ( x) = x
e − e −x
y
g ( x) = x
(4.2)
(4.3)
Identificación de los parámetros controlables.
Determinar la cantidad de datos históricos lags que se utilizarán para el desarrollo de
un modelo de RNA para pronóstico es muy importante puesto que nos indica hasta qué
período en el pasado es significativa la correlación entre los datos.
El número de neuronas en la capa oculta brinda a la RNA la capacidad de aproximar
las relaciones no lineales existentes entre los datos. Por esta razón, debe ser seleccionado
con cuidado pues un número excesivo de neuronas provoca demasiada flexibilidad al
modelo que puede traducirse en el fenómeno de pérdida de la capacidad de predicción
de la red conocida como sobreentrenamiento.
Para llevar a cabo el entrenamiento por retropropagación del error, es decir la
actualización de pesos de las conexiones entre las neuronas, así como la actualización
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
43
de los umbrales en las neuronas de la capa oculta y en la neurona de la capa de salida,
existe una diversidad de algoritmos. En este caso utilizamos el algoritmo de LevenbergMarquard (lm) y el de Regularización Bayesiana (br). Ambos son conocidos como
procedimientos de segundo orden que han demostrado efectividad en el entrenamiento
de RNAs (Bishop, 1995; Hagan et al., 1996; Sözen et al., 2005; Daliakopoulos et al.,
2005).
En cuanto al manejo de los datos se consideraron los parámetros transfomación y
escala; transformación incluyó dos opciones: manejar los datos como demanda puntual
en cada período o como diferencias entre la demanda de períodos adyacentes; por otro
lado, escala se refiere a normalizar los datos para que caigan en una escala de [-1, 1] o
bien manejarlos en su escala original. Son varias las aplicaciones en las cuales los
autores aconsejan el manejo de datos en diferencias y normalizados (Hansen et al., 2003;
Cigizoglu 2003; Gutiérrez-Estrada et al., 2004; González et al., 2005), pues han visto
que la RNA tiene mejor desempeño. Entonces, para determinar si en nuestro caso es
importante el preprocesamiento de datos, consideramos los parámetros transformación y
escala.
En resumen, los parámetros considerados fueros: neuronas, lags, escala,
transformación y algoritmo
Definición de las respuestas de interés (medidas de desempeño de la RNA).
Para medir la calidad del pronóstico (medidas de desempeño) de la RNA se utilizaron
el Error Cuadrado Medio o MSE (Ecuación 4.4); el Error Absoluto Medio o MAE
(Ecuación 4.5); la mayor de las diferencias en las que el valor del pronóstico de la RNA
está debajo del valor deseado (target) lo denominamos como B_Pred (Ecuación 4.6); y
S_Pred (Ecuación 4.7) es la mayor de las diferencias en las que el valor del pronóstico
de la RNA está arriba del valor deseado.
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
44
Tanto MSE como MAE son medidas de desempeño que han sido muy utilizadas en la
literatura, mientras que B_Pred y S_Pred son medidas que en nuestro caso de estudio
resultaron importantes para determinar por una parte, el peor caso de demanda
insatisfecha y por otra parte, el peor caso de capacidad ociosa en la red.
Llamémosle l a la cantidad de patrones de entrenamiento, sea y j el valor deseado
∧
para j = 1,2,...l y sea y j la salida (pronóstico) de la
(target) asociado al patrón j
RNA. A continuación se muestran las ecuaciones correspondientes a las medidas de
desempeño utilizadas.
MSE =
MAE =
1 l ∧
∑ ( y j − y j )2
l j =1
(4.4)
1 l ∧
∑| ( y j − y j ) |
l j =1
∧
B _ Pr ed = max
(y j− yj)
S _ Pr ed = max
(y j − y j )
∧
(4.5)
∧
∀ y j ≤ yj ,
∧
∀ y j ≥ yj
j = 1,2,..., l
(4.6)
j = 1,2,..., l
(4.7)
Una vez que se ha descrito a la RNA como sistema, es decir, ya que se ha
especificado el tipo de RNA, los parámetros a ajustar así como las medidas de
desempeño que medirán las respuestas en nuestro experimento, se procede con el
siguiente paso de la metodología que incluye la planeación, ejecución e interpretación de
un diseño experimental.
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
45
4.2.2. Análisis y Diseño de Experimentos
Dadas las especificaciones anteriores, los parámetros o factores controlables que se
consideraron en el desarrollo de la metodología fueron: neuronas, lags, escala,
transformación y algoritmo, es decir k = 5 .
La experimentación fue planeada para variar lags en el rango [2,6], neuronas en el
rango [2,7], transformación en {ninguna, diferencias}, escala en {observada, [-1,1]} y
algoritmo en {lm,br}. Consideramos 3 niveles para lags y neuronas, mientras que para
transformación, escala y algoritmo se consideraron sólo 2 niveles como se pudo
observar.
Al llevar a cabo el experimento de acuerdo a las especificaciones de la Sección 4.2.1,
se consideró adecuado utilizar un diseño factorial de 32x23 que resultó en un total de 72
combinaciones factoriales para correr el modelo de RNAs.
Los valores específicos que se consideraron para cada factor en su nivel
correspondiente fueron: lags = {2,3,6}, neuronas = {2,5,7}, transformación = {ninguna,
diferencias}, escala = {observada, [-1,1]} y algoritmo = {lm , br}.
Para manejar los valores de los parámetros en forma numérica se utilizó la
codificación siguiente: en el parámetro transformación ‘ninguna’ = 1 y ‘diferencias’ = 2;
en escala, ‘observada’ =1 y ‘[-1, 1]’ =2; mientras que para algoritmo, ‘lm’ = 1 y ‘br’ =
2.
Los resultados del experimento se muestran en la Tabla 4.1. Como puede observarse,
las primeras cinco columnas contienen el valor que tomó cada uno de los factores
(parámetros) en la realización de la corrida del modelo de RNAs. Las columnas
siguientes contienen el valor que tomaron las medidas de desempeño de la RNA para la
combinación de factores dada.
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
46
Tabla 4.1: Resultados del experimento (Primera parte).
Neuronas
Lags
Escala
Transformación
Algoritmo
MAE
MSE
B_Pred
S_Pred
2
2
1
1
1
15.38
717.49
69.89
125.52
2
2
1
2
1
14.83
822.03
73.26
130.74
2
2
2
1
1
14.99
609.14
66.36
105.76
2
2
2
2
1
14.41
808.62
71.63
132.36
2
3
1
1
1
15.39
725.56
70.07
125.99
2
3
1
2
1
15.25
724.62
68.28
135.72
2
3
2
1
1
14.89
613.74
66.36
105.42
2
3
2
2
1
12.53
523.33
69.62
135.46
2
6
1
1
1
15.31
566.63
69.56
116.49
2
6
1
2
1
15.02
578.48
69.35
98.61
2
6
2
1
1
13.43
501.43
69.18
112.18
2
6
2
2
1
10.60
248.54
65.77
41.95
5
2
1
1
1
15.09
698.58
70.89
125.17
5
2
1
2
1
11.80
448.97
65.35
128.56
5
2
2
1
1
12.47
407.59
43.30
114.36
5
2
2
2
1
9.93
440.55
69.97
134.07
5
3
1
1
1
15.01
715.72
69.37
126.64
5
3
1
2
1
14.69
759.51
69.42
142.16
5
3
2
1
1
10.21
355.73
65.85
108.67
5
3
2
2
1
9.78
251.53
70.43
55.35
5
6
1
1
1
15.46
553.00
59.24
101.95
5
6
1
2
1
12.71
545.57
68.51
120.65
5
6
2
1
1
7.04
169.25
30.79
74.33
5
6
2
2
1
3.29
32.99
21.04
13.86
7
2
1
1
1
14.81
700.10
70.41
125.41
7
2
1
2
1
9.09
178.11
65.23
26.45
7
2
2
1
1
8.89
218.43
63.52
57.49
7
2
2
2
1
7.30
147.09
65.69
32.18
7
3
1
1
1
15.28
722.19
69.49
126.43
7
3
1
2
1
11.85
443.52
68.94
114.13
7
3
2
1
1
9.20
310.22
48.55
108.67
7
3
2
2
1
5.49
68.57
17.46
29.64
7
6
1
1
1
14.45
607.09
64.92
121.57
7
6
1
2
1
13.90
461.54
58.44
90.33
7
6
2
1
1
3.59
19.41
13.88
10.82
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
47
Continuación de la Tabla 4.1 Resultados del Experimento (Segunda parte).
Neuronas
Lags
Escala
Transformación
Algoritmo
MAE
MSE
B_Pred
S_Pred
7
6
2
2
1
0.80
1.68
5.04
4.68
2
2
1
1
2
14.71
594.07
62.21
108.03
2
2
1
2
2
17.08
860.04
77.67
126.22
2
2
2
1
2
16.34
752.57
74.73
125.00
2
2
2
2
2
15.58
835.90
73.23
130.77
2
3
1
1
2
14.89
599.43
62.26
107.29
2
3
1
2
2
17.20
869.86
77.72
126.34
2
3
2
1
2
16.44
762.38
74.79
125.03
2
3
2
2
2
15.63
733.86
73.77
135.76
2
6
1
1
2
14.25
487.30
61.59
110.67
2
6
1
2
2
17.52
902.81
77.79
125.84
2
6
2
1
2
15.91
671.52
72.30
112.24
2
6
2
2
2
13.80
453.44
67.84
92.78
5
2
1
1
2
15.08
595.96
58.55
111.78
5
2
1
2
2
16.72
851.16
76.67
126.80
5
2
2
1
2
16.08
744.92
73.82
123.70
5
2
2
2
2
15.58
835.90
73.23
130.77
5
3
1
1
2
13.79
612.04
59.96
118.52
5
3
1
2
2
16.99
860.63
77.22
126.93
5
3
2
1
2
16.15
753.67
73.94
123.64
5
3
2
2
2
15.63
734.32
73.86
135.75
5
6
1
1
2
12.82
489.91
61.46
117.20
5
6
1
2
2
17.41
894.46
77.55
125.49
5
6
2
1
2
15.81
668.94
71.73
113.97
5
6
2
2
2
16.02
768.42
74.90
131.98
7
2
1
1
2
15.05
697.36
69.75
125.30
7
2
1
2
2
16.64
849.40
76.42
126.89
7
2
2
1
2
16.06
743.19
73.85
123.39
7
2
2
2
2
15.58
835.90
73.23
130.77
7
3
1
1
2
15.08
691.16
68.29
126.37
7
3
1
2
2
15.84
809.28
73.67
130.38
7
3
2
1
2
16.11
751.95
73.94
123.30
7
3
2
2
2
15.64
734.34
73.87
135.74
7
6
1
1
2
16.11
654.56
70.27
111.83
7
6
1
2
2
17.32
888.40
77.36
125.23
7
6
2
1
2
16.79
668.00
71.67
114.15
7
6
2
2
2
16.03
769.16
75.02
131.87
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
48
Los resultados detallados de cada uno de los modelos de RNAs resultantes
correspondientes a las combinaciones de los parámetros controlables están contenidos en
el Apéndice A1, en dicho apéndice, se puede encontrar las aproximaciones puntuales que
realizó cada uno de los modelos, así como el valor del pronóstico para el siguiente
período.
4.2.3. Metamodelación
Una vez realizado el experimento, se procedió a caracterizar los resultados mediante
el análisis de varianza con el fin de conocer la contribución que tenía cada uno de los
factores en las medidas de desempeño de la RNA. De esta manera se obtuvo un modelo
de regresión como el de la Ecuación 3.1 para cada una de las medidas de desempeño
especificadas en la Sección 4.2.1. Recordemos que cada xi
para i = 1,2,..., k .
corresponde a uno de los parámetros que se decidieron variar en el diseño experimental.
De esta manera, x1 corresponde al factor neuronas; x2 representa al factor lags; x3
corresponde al factor escala; x4 representa al factor transformación y por último x5
corresponde al factor algoritmo.
Los coeficientes resultantes a partir del análisis de varianza para las variables de
regresión en cada medida de desempeño se muestran en la Tabla 4.2. En las dos últimas
filas de esta Tabla se muestran dos cantidades adicionales que el software presenta
además de los resultados del análisis de varianza básico.
La cantidad R
2
se interpreta como el porcentaje de variabilidad total en los datos
explicada a través del modelo de regresión utilizado en el análisis de varianza. Por tanto,
es deseable que esta cantidad sea cercana al 100%. La otra cantidad R
2
ajustada
es una
variante de la anterior, difiere de ésta puesto que refleja el número de parámetros
significativos en el modelo. Es decir, la cantidad R
2
ajustada
decrece a medida que se
utilizan términos no significativos en el modelo. El estadístico R
2
ajustada
es útil en
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
49
experimentos muy complejos en los que intervienen varios factores en el diseño y se
quiere evaluar el impacto de aumentar o disminuir el número de términos presentes en el
modelo.
Tabla 4.2: Resultados del análisis de varianza para cada medida de desempeño.
Variable de Regresión
MAE
MSE
B_Pred
S_Pred
Constante
29.82
1726.89
102.61
219.74
x1
x2
x3
-1.08
-84.40
0.13
4.36
0.55
-4.72
1.58
20.73
-1.92
-178.61
0.88
-23.03
-1.67
-100.62
9.10
-9.47
-14.15
-935.46
-61.57
-145.98
0.02
-0.15
0.07
-1.41
-0.08
-6.00
-0.13
-2.83
0
0
0
0
0
0
0
0
0
0
0
0
0.01
7.41
-0.61
0.61
-0.52
-25.08
-2.99
-4.35
x1 x4
x1 x5
-0.21
-21.05
-1.08
-3.57
1.00
68.57
3.94
9.57
x2 x3
-0.74
-37.02
-3.41
-7.30
x 2 x4
x2 x5
0.06
4.64
-0.61
-2.19
0.52
25.07
4.13
6.03
x3 x4
-1.71
-101.01
-6.87
-7.87
x3 x5
4.84
291.74
19.42
42.71
x4 x5
2.91
237.47
7.45
27.82
88.20%
86.30%
73%
73.00%
84.50%
81.90%
64.70%
64.5%
x4
x5
x1
2
x2
2
x3
2
x4
2
x5
2
x1 x2
x1 x3
R
R
2
2
ajustada
En general, se busca que la diferencia entre estas dos cantidades R
2
y R
2
ajustada
sea
pequeña, para poder asumir que el modelo de regresión aproxima bien la superficie de
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
50
respuesta. Una diferencia mayor de 20% indica un posible problema entre el modelo y
los datos (Montgomery, 2004).
Nótese que al aproximar los datos mediante modelos de regresión se parte del
supuesto de que los residuos son independientes, siguen una distribución normal y tienen
varianza constante. Para asegurar que nuestras conclusiones tengan bases estadísticas
sólidas es importante la comprobación de dichos supuestos. La técnica que utilizamos
para ello fue el análisis de residuos.
Por ejemplo, la Figura 4.3 y la Figura 4.4 nos muestran las gráficas utilizadas en el
análisis de residuos para probar los supuestos del modelo de regresión correspondiente a
la medida de desempeño de B_Pred. En la Figura 4.3 las gráficas de la izquierda nos
permiten comprobar el supuesto de normalidad de los residuos: en la gráfica superior lo
que se busca es que los residuos se aproximen lo más posible a una línea recta; el
histograma de frecuencias deberá comportarse como una muestra de distribución normal
con centro en cero. Las gráficas de la derecha son utilizadas para la comprobación del
supuesto de independencia estadística: en éstas se debe visualizar que los valores de los
residuos no sigan alguna estructura reconocida. El comportamiento en la gráfica de
Residuos vs. Valor ajustado muestra una agrupación de los valores en una región, este
comportamiento nos acusó a que el supuesto de independencia podría ser violado. Así
que recurrimos a una prueba de correlación de residuos contra valor ajustado para
comprobar la independencia y obtuvimos un coeficiente de correlación de 0.001 con un
valor P=0.995. Por tanto, concluimos que los residuos cumplieron con el supuesto de
independencia estadística.
Información detallada acerca de este análisis gráfico de los residuos se puede
encontrar en Montgomery (2004).
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
Probabilidad Normal
Residuos vs Valor Ajustado
99.9
20
10
90
Residuo
Percentil
99
50
10
0
-10
1
0.1
-20
-20
-10
0
Residuo
10
20
20
Histograma de los Residuos
80
Residuos vs Orden de los Datos
10
18
Residuo
Frecuencia
40
60
Valor A justado
20
24
12
0
-10
6
0
51
-20
-20
-10
0
Residuo
10
20
0
15
30
45
Orden de Observación
60
Figura 4.3: Gráficas para comprobación de normalidad e independencia estadística de
los residuos en el modelo de regresión de la B_Pred.
Para comprobar el supuesto de varianza constante, se graficaron los residuos
asociados a cada una de las medidas de desempeño contra cada una de las variables o
factores, que en nuestro caso fueron: neuronas, lags, escala, transformación y
algoritmo. Por ejemplo, la Figura 4.4 contiene las gráficas resultantes para residuos
contra variables para el caso de la medida de desempeño B_Pred. Si los residuos tienen
desviaciones aproximadamente constantes a lo largo de los diferentes valores (niveles)
de cada uno de los factores o variables, se dice que se cumple el supuesto de igualdad de
varianza.
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
52
Residuos vs. Neuronas
Residuos vs. Lags
20
Residuo
Residuo
20
0
0
-20
-20
2
5
2
7
3
6
Lags
Neuronas
Residuals Versus Escala
Residuos vs. Transformación
20
Residuo
Residuo
20
0
0
-20
-20
1
1
2
2
Transformación
Escala
Residuos vs. Algoritmo
Residuo
20
0
-20
1
2
Algoritmo
Figura 4.4: Gráficas de Residuos vs. Variables para la comprobación de igualdad de
varianza en los residuos del modelo de regresión de la B_Pred.
Como puede observarse, tanto en la Figura 4.3 como en la Figura 4.4, el modelo de
regresión para B_Pred cumplió suficientemente con los supuestos establecidos.
Entonces concluimos que el modelo fue apropiado y proseguimos con la interpretación
de los resultados tomando como base este modelo. Algunas veces no será fácil
determinar si estos supuestos se cumplen y deberá recurrirse a pruebas estadísticas
formales que se pueden encontrar en fuentes como Devore (1995). Los resultados
completos acerca del análisis de residuos para cada una de las medidas de desempeño, se
encuentran en el Apéndice A2.
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
53
De acuerdo a la metodología propuesta, se consideró aplicar optimización a los
modelos encontrados para determinar qué valores debían tomar cada uno de los factores
para mejorar el desempeño de la RNA, este paso se describe a continuación.
4.2.4. Problemas de Optimización y Solución
Considerando la formulación 3.2 y los resultados mostrados en la Tabla 4.2, se
construyeron los problemas de optimización correspondientes a cada medida de
desempeño. La modelación de éstos se realizó en Excel, el Apéndice A3 muestra de
manera detallada los resultados de la optimización. Una vez que se tuvo la modelación,
se procedió a resolver de forma independiente cada uno de los modelos utilizando
múltiples soluciones iniciales. La Tabla 4.3 muestra la evaluación de las mejores
soluciones a las cuales se tuvo convergencia partiendo de múltiples soluciones iniciales
en las diferentes medidas de desempeño.
La primera columna de la Tabla 4.3 contiene las mejores soluciones. Cada solución
que representa una combinación de los parámetros de la RNA a los cuales les
corresponde un determinado valor objetivo en cada medida de desempeño, determinado
por el metamodelo encontrado. Así por ejemplo, la solución (2, 2, 1, 1, 2) indica la
asignación siguiente: neuronas = 2 ; lags =2; escala = 1 u ‘observada’; transformación =
1 o ‘ninguna’ y algoritmo = 2 o ‘br’; tal asignación dio el siguiente resultado en el valor
objetivo de las medidas de desempeño: MAE =13.73; MSE = 578.49; B_Pred = 53.17
y S_Pred = 91.74. Las funciones objetivo son metamodelos que aproximan nuestras
medidas de desempeño, por ello es posible que en la optimización alcancen valores
negativos, sin embargo al correr el modelo real de RNA las medidas de desempeño
toman siempre valores positivos.
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
54
Tabla 4.3: Mejores soluciones encontradas.
Solución
2,2,1,1,2
2,6,1,1,2
7,2,1,1,2
7,2,1,2,2
7,6,2,1,1
7,6,2,2,1
MAE
13.73
15.02
15.70
16.79
6.60
3.30
MSE
578.49
497.93
678.89
814.13
136.81
-47.87
B_Pred
53.17
67.48
70.06
78.44
26.61
18.24
S_Pred
91.74
99.36
112.11
121.08
41.65
6.18
Como puede observarse en la Tabla 4.3, la mejor solución encontrada fue (7, 6, 2, 2,
1) , ésta indicó que se debían manejar los datos en diferencias y en escala [-1,1],
utilizando como entrada las diferencias de la demanda registrada en los últimos 6
períodos con 7 neuronas en la capa oculta y el algoritmo de entrenamiento lm. La RNA
correspondiente a esta solución se comporta como se muestra en la Figura 4.5, las
medidas de desempeño en el modelo de RNA adquirieron los siguientes valores: MSE =
0.80, MAE = 1.68, B_Pred = 5.04 y S_Pred = 4.68 .Puede observarse que este modelo
hace una muy buena aproximación de los datos reales. Esta fue la mejor solución que
encontró el paquete computacional de optimización al minimizar cada una de las
medidas de desempeño.
La solución obtenida resultó ser la mejor para todas las medidas de desempeño
utilizadas, así que pudimos concluir que en este caso particular las medidas de
desempeño estaban altamente correlacionadas. Si por el contrario, los objetivos o
medidas de desempeño hubiesen llevado a soluciones distintas entre sí, tomar una
decisión acerca de cuáles eran los mejores valores de los parámetros de la RNA sería
una tarea más complicada. En tal caso sería necesaria la utilización de técnicas de
optimización multicriterio.
Es necesario comentar que, aunque describimos previamente el fenómeno de
sobreentrenamiento, en este caso específico no se consideró explícitamente. El objetivo
de este caso fue inicialmente probar la metodología, sin embargo, la técnica de
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
55
validación cruzada se utiliza para evitar el sobreentrenamiento de la RNA en el Capítulo
5.
Real
RNAs
800
Unidades de Demanda
700
600
500
400
300
200
100
0
1
7
13
19
25
31
37
43
49
55
61
67
Tiempo (meses)
Figura 4.5: Modelo de RNAs vs Modelo Real.
Una vez que se aplicó la optimización con los modelos de regresión, concluimos que
la solución final especificó los valores que debían tomar los parámetros para que la RNA
resultante tuviera un desempeño adecuado.
Las herramientas computacionales utilizadas para la ejecución del procedimiento
propuesto fueron Matlab, Minitab y Excel. El primero fue utilizado para construir los
modelos de RNAs, el segundo para el análisis estadístico y el tercero para realizar la
optimización a través de su herramienta XL Solver.
Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período
56
4.3. Conclusiones
En este capítulo se probó la metodología propuesta en el Capítulo 3, para seleccionar
los parámetros que intervienen en la construcción y utilización de RNAs. Se pudo
demostrar que la metodología trabaja bien por medio de un caso práctico de predicción
de demanda en la industria de las telecomunicaciones.
La metodología propuesta puede aplicarse a RNAs con arquitecturas más
complicadas, tales como las utilizadas para predecir varios períodos de demanda en el
futuro. La consecución del trabajo aquí presentado consideró precisamente este caso de
predicción multiperíodo en el cual se pronosticaron doce períodos. Este caso se describe
en el siguiente capítulo.
CAPÍTULO 5
PRONÓSTICO DE SERIES DE
TIEMPO DE MÚLTIPLES PERÍODOS
Introducción
Un problema común en el pronóstico de series de tiempo es la baja exactitud de los
pronósticos a largo plazo. El valor estimado de una variable a corto plazo puede
realizarse con exactitud aceptable, sin embargo, para estimarlo a largo plazo es
comúnmente menos exacto (Hanh et al., 2004). El pronóstico a largo plazo ha sido
utilizado en la planeación de expansión de capacidad, inversión de capital, análisis de
ingresos y estimación del presupuesto de una empresa, aunque en cada aplicación es
evidente la gran incertidumbre causada por el horizonte de tiempo z pronosticar (AlSaba et al., 1999).
Para tratar este problema, han sido desarrolladas diferentes técnicas mediante el uso
de RNAs. Entre las más utilizadas destacan las técnicas iterativas que utilizan un modelo
de RNA multicapa con una sola salida (representado en la Figura 4.2) de manera
recursiva para predecir múltiples períodos. Otra técnica es el uso de multiples RNAs
57
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
58
desarrolladas cada una de manera independiente para un horizonte de planeación
distinto. Por último, el uso de un modelo de RNA más complejo, en el cual la RNA tiene
múltiples salidas dependiendo del número de períodos a predecir. Esta técnica, se espera
que conduzca a mejores resultados (Zhang, 2004) que las dos descritas anteriormente,
sin embargo, aún no está teóricamente demostrado.
En este capítulo se hace uso de una RNA con múltiples salidas para predecir el
comportamiento de la demanda de la empresa de telecomunicaciones, teniendo como
objetivo pronosticar 12 períodos futuros. Se analizaron dos series de tiempo
proporcionadas por la empresa, utilizamos períodos de tiempo mensuales y la
construcción del modelo de RNA se realizó mediante la aplicación de la metodología
propuesta en el Capítulo 3.
En la Sección 5.1 se describe el problema de la empresa de telecomunicaciones, en la
Sección 5.2 se explica la construcción de los modelos de RNAs para cada una de las
series analizadas y por último, en la Sección 5.3 se presentan las conclusiones.
5.1. Pronóstico de Demanda en telecomunicaciones: múltiples
períodos
Como se dijo en el Capítulo 1, se dispone de una red de transmisión con capacidad
finita y una demanda con comportamiento estocástico. Año con año el comité de
planeación de la empresa realiza una reunión antes de concluir el año para analizar el
comportamiento de la demanda hasta el momento presente con el propósito de estimar el
comportamiento de la misma para el año siguiente. A partir de la estimación realizada
deben planear el uso adecuado del capital con el que cuenta la empresa.
Para un buen uso del capital, el comité de planeación debe estimar el presupuesto que
se necesitará para satisfacer la demanda estimada, así mismo como determinar qué
momento es el más apropiado para hacer uso del mismo. Los equipos la empresa maneja
son muy costosos y cuando se requiere realizar una expansión de capacidad, el proceso
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
59
de compra e instalación de equipo toma un período de aproximadamente 4 meses. Es
necesario entonces tener una visión hacia el futuro que permita prever el crecimiento de
la demanda y de esta manera generar la solicitud de compra e instalación de nuevos
equipos en la red de transmisión. De lo contrario, se presentará el problema de clientes
insatisfechos y no se cumplirá con el objetivo de alto nivel de servicio.
En este caso, nuestro objetivo es brindarle al tomador de decisiones un modelo que
aproxime el comportamiento de la demanda y que permita pronosticar el
comportamiento mensual de ésta con un horizonte de pronóstico a 12 meses. De esta
manera, el tomador de decisiones estará en condiciones de realizar al fin del año, una
estimación del presupuesto que será necesario para satisfacer la demanda del año
venidero, y al analizar la demanda mes con mes, tendrá la capacidad de determinar si es
necesaria una expansión y en qué momento debe hacerla. Así se incurrirá en la
minimización de costos y maximización de clientes satisfechos.
Para nuestro estudio contamos con dos series de tiempo que representan el
comportamiento de la demanda registrada a lo largo del tiempo, cada una de éstas
corresponde a la demanda de un tipo de servicio de los que brinda la empresa. Tales
series de tiempo se presentan en las Figuras 5.1 y 5.2 respectivamente.
Unidades de Demanda
800
700
600
500
400
300
200
100
0
1
7
13
19
25
31
37
43
49
55
61
67
Tiempo (meses)
Figura 5.1: Comportamiento de la demanda, Serie 1.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
60
Pudo observarse que la demanda se comporta de manera diferente dependiendo del
tipo de servicio del que se trate. La práctica común de aproximar las series de tiempo por
medio de una tendencia lineal es claramente inadecuada en estos casos, en el Capítulo 6
se presenta mayor evidencia acerca de esto.
250
Unidades de Demanda
200
150
100
50
0
1
7
13
19
25
31
37
43
49
55
61
67
Tiempo (meses)
Figura 5.2: Comportamiento de la demanda, Serie 2.
Fue claro que las decisiones estratégicas y tácticas de la empresa se basan en la
realización de pronósticos y por tanto requerimos construir un buen modelo que les
permita obtener pronósticos confiables. Con esto en mente, se construyó un modelo para
cada una de las series aquí mostradas basado en RNAs. La arquitectura de la RNA
utilizada es similar a de la Figura 5.3, en la cual se obtiene como salida el valor del
pronóstico para los siguientes doce meses. Las especificaciones del modelo y la
selección de parámetros se presentan de manera detallada a continuación.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
61
5.2. Construcción de un Modelo de RNA para Pronóstico de
Series de Tiempo de múltiples períodos
Teniendo como principal objetivo construir un modelo de RNA con características
que permitan encontrar pronósticos acertados para un horizonte de planeación de doce
meses, aplicamos la metodología descrita en el Capítulo 3 considerando las series de
tiempo mostradas en la Figura 5.1 y Figura 5.2.
5.2.1. Descripción de la RNA como Sistema
Determinación del tipo de RNA que se utilizó para el análisis.
Para el análisis de las series utilizamos un modelo de RNA como el representado en
la Figura 5.3. Es una RNA de tres capas hacia delante entrenada por retropropagación
del error.
Puesto que en esta aplicación nuestro objetivo era pronosticar el comportamiento de
la demanda para los siguientes doce períodos, cada patrón de entrenamiento o validación
tenía asociado un vector de doce valores (target) formado por la demanda registrada en
los doce meses siguientes a partir del último registro considerado en el patrón de
entrada. Cabe señalar que la cantidad de valores en el patrón de entrada determina la
cantidad de neuronas en la capa de entrada.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
W
Y
ji
V
t
62
sj
Y
Y
t + 1
t − 1
Y
.
.
.
.
.
.
t + 2
.
.
.
Yt −m +1
Yn
Yt − m
b
Capa de Entrada
b
s
j
Capa Oculta
Capa de Salida
Figura 5.3: Red neuronal artificial de propagación hacia adelante, entrenada
por retropropagación del error de pronóstico con tres capas y múltiples
salidas.
En esta RNA se tienen n neuronas en la capa de salida cada una de las cuales calcula
el valor del pronóstico para cada período futuro. Si actualmente estuviéramos en el
período t , las neuronas de salida nos darían el pronóstico para los períodos t + 1 hasta
el período t + n , donde en nuestro caso n = 12 . La representación matemática de la
RNA es la descrita en la Ecuación (4.1), sólo que en este caso la salida fue un vector con
12 componentes.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
63
Los resultados obtenidos en el capítulo anterior para una RNA con una salida que
pronostica un solo período mostraron que es importante el preprocesamiento de la
información con la cual se alimenta a la RNA y además, el algoritmo de entrenamiento
lm resultó con un mejor desempeño en el modelo. En este caso, incorporamos tales
consideraciones para llevar a cabo la construcción del modelo de RNA para múltiples
períodos. Es decir, utilizamos la información normalizada en la escala [-1, 1] y para
llevar a cabo el entrenamiento de la RNA utilizamos el algoritmo de LevenbergMarquard (lm).
Identificación de los parámetros controlables.
El número de neuronas en la capa oculta debe ser ajustado y por tanto fue incluido
como parámetro controlable de manera similar que en el caso anterior, nuevamente lo
denominamos como neuronas.
Otro parámetro más que se incluyó en el desarrollo del modelo, fue la cantidad de
datos históricos o lags que se utilizarían como entradas de la RNA para el cálculo de los
pronósticos. Como ya se mencionó, éste es muy importante puesto nos indica hasta qué
período en el pasado se correlacionan los datos.
Definición de las respuestas de interés (medidas de desempeño de la RNA).
Para medir la calidad de aproximación de la RNA es común el uso de validación
cruzada. Como se describió en el Capítulo 2, la manera de seleccionar los subconjuntos
de entrenamiento y validación no está estandarizada. En varios trabajos se seleccionan
éstos ya sea de manera conveniente o bien no se menciona cómo lo hacen.
Especialmente en pronósticos, es posible realizar la selección de forma tal que se sesgue
el desempeño de cada método o modelo.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
64
El conjunto de entrenamiento estuvo formado por aproximadamente el 70% de los
patrones disponibles y el de validación se definió utilizando aproximadamente el 30% de
éstos. Los elementos del conjunto de validación fueron seleccionados mediante una
distribución uniforme sin reemplazo con el propósito de otorgar el mayor conocimiento
a la RNA y evitar el sesgar la información disponible. Utilizamos esta proporción en los
subconjuntos, pues ha sido sugerida en la literatura (Zhang et al., 1998; Granger 1993).
El desempeño de la RNA fue cuantificado mediante el Error Cuadrado Medio o MSE,
considerando a éste tanto para la fase de entrenamiento (MSE_T) como para la fase de
validación (MSE_V) del modelo.
Generalmente, la inicialización de los pesos de las conexiones de la RNA se realiza
de manera aleatoria, en nuestra aplicación, utilizamos diferentes puntos de inicio para
los pesos de las conexiones.
Consideramos inicios múltiples ya que al hacer la actualización de pesos mediante la
retropropagación del error realmente se está minimizando una función de error, que es
no lineal y no convexa, por tal razón, el punto de inicio de la optimización es
determinante para los pesos finales que adquieren las conexiones una vez que el
entrenamiento termina. Los diferentes puntos de inicio de los pesos de las conexiones
entre las neuronas y umbrales con neuronas fueron:
•
Inicialización de los pesos en 0.
•
Inicialización aleatoria en el intervalo [-1, 1].
•
Inicialización de pesos en -0.5.
•
Inicialización de pesos en 0.5.
•
Inicialización de pesos en -1.
•
Inicialización de pesos en 1.
Esta manera de inicialización del modelo de RNA permite tener un mejor control del
comportamiento del modelo, es decir, permite la reproducción de los resultados puesto
que se sabe con certeza los puntos de inicio del modelo bajo los cuales la RNA obtiene
cierto valor en la medida de desempeño. Si sólo se utilizara la inicialización aleatoria,
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
65
sería difícil la reproducción de los resultados pues se desconocerían las condiciones
iniciales bajo las cuales se construyó el modelo.
Las especificaciones aquí descritas, fueron las mismas para la modelación de las dos
series mostradas anteriormente, sin embargo, el Análisis y Diseño de Experimentos fue
distinto dependiendo de la serie. A continuación se describe esta etapa de la
metodología, aplicada a cada una de las series.
5.2.2 Análisis y Diseño de Experimentos para la Serie 1
Dadas las especificaciones anteriores, los parámetros o factores controlables que se
consideran en el desarrollo de la metodología fueron: lags y neuronas, es decir k = 2 .
La experimentación fue planeada para variar lags en el rango [3,15] y neuronas en el
rango [2,10]. Consideramos 5 niveles de cada uno de éstos parámetros. Los valores
específicos que se consideraron para cada factor en su nivel correspondiente fueron:
lags = {3, 6, 9, 12, 15} y neuronas = {2, 4, 6, 8, 10}. En el experimento se utilizó un
diseño factorial que resultó en un total de 25 combinaciones factoriales para correr el
modelo de RNAs.
Cada combinación factorial determina el valor al cual deben fijarse los parámetros
controlables del modelo. Para cada una de éstas construimos un modelo de RNA
utilizando las múltiples inicializaciones y finalmente seleccionamos como resultado de
la combinación de factores aquélla RNA con menor MSE_V. Es decir, para cada
combinación de factores creamos seis RNAs diferentes, cuantificamos el valor de las
medidas de desempeño utilizadas en cada una de las seis RNAs y al final seleccionamos
la RNA con el MSE_V más pequeño. Por supuesto que se registró el valor con el cual
fue inicializada la mejor RNA para facilitar la reproducción de los resultados. Los
resultados del experimento se muestran en la Tabla 5.1.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
66
Tabla 5.1: Resultados del experimento de la Serie 1.
Lags Neuronas MSE_T MSE_V
Inicio
3
2
2104.8
1767
0
3
4
340.7
653.2
-1
3
6
268.6
734.1
Aleatorio
3
8
169.7
1757.3
0.5
3
10
2066.8
1739.8
0
6
2
625.8
1221.9
Aleatorio
6
4
243.1
612.9
0
6
6
154.2
611.4
Aleatorio
6
8
102.8
3454.3
Aleatorio
6
10
9
2
775.4
1665.2
Aleatorio
9
4
252.9
1401
Aleatorio
9
6
151.8
1252.4
-0.5
9
8
9
10
44.4
6668.9
0.5
12
2
403.8
1203.4
Aleatorio
12
4
218.3
5754.3
Aleatorio
12
6
15357.7
14775
0
12
8
15357.7
14775
0
12
10
15357.7
14775
0
15
2
574.5
1828.6
-1
15
4
10864.5 13646.8
0
15
6
10864.5 13646.8
0
15
8
10864.5 13646.8
0
15
10
10864.5 13646.8
0
21338.1 25253.7
20364.7 15741.9
0
0
Como puede observarse en la Tabla 5.1 las primeras dos columnas contienen el valor
que tomó cada uno de los factores (parámetros) para realizar la corrida del modelo de
RNAs. La tercer y cuarta columna contiene el valor que alcanzaron las medidas de
desempeño de la RNA en el entrenamiento y validación respectivamente, mientras que
en la última columna se muestra el valor al cual fueron inicializados los pesos de las
conexiones de la RNA.
Los resultados detallados de cada uno de los modelos de RNAs resultantes
correspondientes a las combinaciones de los parámetros controlables están contenidos en
el Apéndice B1, donde se muestra el pronóstico que se obtuvo con cada uno de los
modelos de RNAs experimentales.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
67
5.2.2.1. Metamodelación
Una vez realizado el experimento, se procedió a caracterizar los resultados mediante
el análisis de varianza con el fin de conocer la contribución de cada uno de los factores
en las medidas de desempeño de la RNA. El modelo de regresión propuesto fue el
descrito en la Ecuación 3.1. De esta manera, se obtuvo un modelo de regresión para cada
una de las medidas de desempeño especificadas en el paso anterior. Siguiendo la
notación del Capítulo anterior, x1 corresponde al factor lags y x2 representa al factor
neuronas.
La Tabla 5.2 contiene los coeficientes del modelo de regresión resultantes para las
medidas de desempeño, contiene también los valores P asociados a cada término de
regresión y los valores del coeficiente de determinación ajustado y no ajustado. El valor
P es utilizado para determinar si un término de regresión (fuente de variación) afecta
significativamente a la medida de desempeño, mediante una prueba de hipótesis.
Considerando como hipótesis nula que la fuente de variación no afecta
significativamente la medida de desempeño, el valor P indica el nivel de significancia
mínimo para el cual la hipótesis nula es rechazada. Es decir, P puede considerarse como
el menor nivel α en el que la fuente de variación es significativa. Por tanto, para
concluir si una fuente de variación es significativa, basta con saber si el valor P es menor
que α , dado que se hayan cumplido los supuestos de los residuos.
En la Tabla 5.2 la tercera columna contiene los valores P asociados a las fuentes de
variación en el modelo correspondiente al MSE_T y la quinta contiene los P
correspondientes al MSE_V.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
68
Tabla 5.2: Resultados del análisis de varianza en las medidas de desempeño, Serie 1.
Variable de Regresión
MSE_T
P
MSE_V
P
Constante
-5828.99
0.568
-6087.75
0.490
x1
x2
1917.23
0.700
2316.88
0.590
1491.84
0.764
1289.84
0.764
-205.31
0.785
-139.45
0.830
-58.01
0.938
86.54
0.894
454.17
0.473
304.32
0.576
x1
2
2
x2
x1 x2
R
R
2
42.80%
55.10%
27.70%
43.30%
2
ajustada
Como se observa en la Tabla 5.2, para el MSE de entrenamiento sólo un 27.7% de la
variación total es explicada con el modelo de regresión y para el MSE de validación sólo
un 43.3% de su variación se explica con el modelo utilizado. Es decir, los coeficientes
de determinación para ambas medidas de desempeño son muy bajos. Además los valores
de P asociados a los coeficientes de ambos modelos no acusan algún efecto importante.
Lo anterior nos llevaría a concluir que si tratamos de explicar la variabilidad que
produce cada factor en la medida de desempeño, tomando como base el modelo de
regresión encontrado, no se tendrían bases estadísticas fuertes que apoyaran nuestras
conclusiones.
Para tener una visión más clara acerca de los resultados obtenidos en el experimento,
realizamos un análisis de la superficie de cada respuesta o medida de desempeño
mediante gráficas de contorno y de superficie. En la Figura 5.4 se muestran las gráficas
resultantes.
En base al comportamiento que mostraron las medidas de desempeño en la Figura
5.4, fue posible identificar que tanto para el MSE de entrenamiento como para el MSE de
validación existía una región de los factores lags y neuronas que proporcionaba un buen
desempeño al modelo de RNAs.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
69
Empíricamente fue posible ubicar tanto en las gráficas de contorno como en las de
superficie una región en la cual las medidas de desempeño eran pequeñas. Esta región
está delimitada por los 3 primeros niveles de cada factor (lags y neuronas) como se
puede apreciar en la Figura 5.4.
Guiándonos por los resultados gráficos, se observó claramente que al utilizar más de
12 datos históricos y más de 6 neuronas en la capa oculta el desempeño del modelo de
RNAs no sólo empeoró sino que se volvió altamente no lineal impidiendo así una
regresión adecuada.
MSE_T
15.0
MSE_V
15.0
8000
10000
16000
12.5
12.5
15000
16000
10.0
20000
7.5
Lags
Lags
10.0
8000
15000
7.5
12000
4000
5000
5.0
15000
5.0
2
4
6
8
10
2
4
6
Neuronas
8
10
Neuronas
20000
20000
MSE_T
10000
MSE_V
10000
0
15
15
0
10
10
3
6
Neuronas
9
5
Lags
3
6
Neuronas
Lags
5
9
Figura 5.4: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V
experimental en la Serie 1.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
70
Al considerar el análisis anterior decidimos enfocar (reducir) el área experimental
con el fin de encontrar metamodelos confiables. Se consideraron únicamente aquéllos
modelos de RNAs con parámetros dentro del rango identificado gráficamente con buen
desempeño, es decir, modelos en los cuales los parámetros lags y neuronas estaban
dentro de sus tres primeros niveles. Se tomaron entonces las corridas experimentales
resultantes de la combinación de lags = {3, 6, 9} y neuronas = {2, 4, 6}.
Una vez que enfocó el experimento, se realizó nuevamente el análisis de varianza
para estos resultados, logrando así coeficientes de determinación mayores a los
obtenidos inicialmente como se puede observar en la Tabla 5.3 La interpretación de esta
tabla es similar a la de la Tabla 5.2.
Tabla 5.3: Resultados del análisis de varianza en las medidas de desempeño, Serie 1
(Experimento enfocado).
Variable de Regresión
MSE_T
Constante
x1
x2
x1
2
2
x2
x1 x2
R
R
P
MSE_V
P
5611.64
0.032
4518.51
0.009
-698.07
0.151
-612.13
0.046
-1349.81
0.090
-965.59
0.040
34.23
0.314
47.79
0.045
100.29
0.214
79.90
0.091
50.53
0.192
25.83
0.190
2
87.40%
94.00%
66.30%
84.10%
2
ajustada
En la Tabla 5.3 se observa que los coeficientes de determinación para ambas medidas
de desempeño son mayores del 80%, por tanto, podemos decir que los modelos de
regresión son apropiados para describir buena parte de la variabilidad de las medidas de
desempeño utilizadas. Cabe señalar, que en este caso, existe mayor diferencia entre R
2
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
y R
2
ajustada
debido a que R
2
ajustada
71
penaliza la incorporación de términos no significativos
en el modelo.
Con estos nuevos resultados del análisis de varianza, cabe hacer notar los resultados
benéficos de enfocar el experimento, esto es, de reducir el área experimental. Enfocar el
experimento será de gran utilidad cuando se presenten resultados como los que
encontramos durante el análisis de este caso.
En la Figura 5.5 se muestra gráficamente las gráficas de contorno y superficie
descritas por las medidas de desempeño en el área experimental reducida. Observamos
que las gráficas de superficie están definidas por curvas más suaves que en la Figura 5.4
haciendo más sencilla la aproximación de las mismas mediante los modelos de
regresión.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
72
MSE_T
MSE_V
9.0
9.0
1200
1000
7.5
6.0
Lags
Lags
7.5
500
4.5
3.0
6.0
800
4.5
2
3
4
5
6
3.0
2
3
4
Neuronas
Neuronas
5
6
2000
1500
1500
MSE_V
MSE_T
1000
1000
500
500
2
2
4
Neuronas
Neuronas
4
8
6
6
4
6
Lags
4
8
6
Lags
Figura 5.5: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V
en el experimento enfocado.
Ahora bien, comparando los modelos de aproximación (metamodelos) antes y
después de enfocar el experimento, la Figura 5.6 muestra claramente el cambio
producido por la reducción del área experimental. Los modelos de regresión para las
medidas de desempeño pasaron de ser superficies no convexas a superficies convexas.
Estos resultados son muy convenientes en términos de optimización. Con este
comportamiento corroborado gráficamente y el hecho de que los metamodelos son
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
73
regresiones de segundo orden, es posible asegurar empíricamente la existencia de un
óptimo global en el área experimental de cada una de las medidas de desempeño.
MSE_V
(Enfocado)
MSE_V
4000
25000
3000
2000
20000
1000
15000
0
-1000
10000
-2000
C13
Lags
C5
9
C1
9
5
7
C1
5
-5000
7
Lags
3
1
C5
C9
1
0
C13
-3000
-4000
C9
3
5000
Neuronas
Neuronas
MSE_T
(Enfocado)
MSE_T
2000
25000
1000
20000
0
-1000
15000
-2000
10000
-3000
C13
5000
C9
C5
Neuronas
C1
9
7
3
5
1
0
Lags
-4000
C13
-5000
C9
C5
-6000
1 2 3
4 5 6
7 8 9
10
Neuronas
Lags
C1
Figura 5.6: Superficie de los metamodelos para el MSE_T y MSE_V antes y después del
enfoque del Experimento.
El enfoque del experimento nos permitió mejorar la calidad de la aproximación de los
metamodelos obtenidos mediante el análisis de varianza en áreas experimentales de
interés. Esta mejora nos sirvió para sustentar nuestras conclusiones acerca de la
variación producida por los parámetros en las medidas de desempeño y nos brindó la
certeza de que la optimización tendrá como base un metamodelo confiable con
fundamento estadístico.
Regresando a la Figura 5.4 y suponiendo que colocamos las gráficas de contorno una
encima de la otra, la intersección de éstas nos da las combinaciones de parámetros que
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
74
mejoran simultáneamente ambas medidas de desempeño. Basados en estas gráficas se
puede decir que el modelo de RNA con mejor desempeño de acuerdo a las medidas
utilizadas, sería aquél en el cual el factor neuronas estuviera dentro del rango [4,6] y el
factor lags en el rango de variación de [3, 6]. Sin embargo, para determinar los valores
puntuales que debían tomar los parámetros de la RNA fue necesario recurrir a la
optimización. Por supuesto, tampoco se pasó por alto la comprobación de los supuestos
bajo los cuales fueron construidos los metamodelos. La comprobación se realizó de la
misma forma como se presentó en el Capítulo 4, es decir, mediante el análisis gráfico de
los residuos. Las gráficas utilizadas en el análisis de residuos para este caso están
disponibles en el Apéndice B2.
5.2.2.2. Problemas de Optimización y Solución, Serie 1
Comprobados los supuestos, construimos los problemas de optimización como se
muestra en la formulación (3.2) a partir de los metamodelos y realizamos la
optimización. Se utilizaron nuevamente múltiples soluciones iniciales para probar si
efectivamente se convergía a una misma solución, pues tal comportamiento apoya la
hipótesis de convexidad, establecida empíricamente en el paso anterior.
Las Tablas 5.4a y 5.4b muestran las soluciones a las cuales convergieron cada uno
de los modelos de optimización. La primera componente de la solución corresponde al
valor que tomó el parámetro lags y la segunda componente corresponde al valor del
parámetro neuronas. La segunda y tercera columna muestra el valor de la función
objetivo para el MSE_T y el MSE_V respectivamente. Recuérdese que las funciones
objetivo son metamodelos que aproximan la superficie de respuesta de la RNA, por
tanto es posible que en la optimización alcancen valores negativos, sin embargo en el
modelo real de RNA las medidas de desempeño toman siempre valores positivos.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
75
Tabla 5.4a: Soluciones finales al minimizar el MSE_T, Serie 1.
Solución Inicial Solución Final MSE_T MSE_V
(3,2)
(7,5)
-71.07
648.91
(6,4)
(7,5)
-71.07
648.91
(9,6)
(7,5)
-71.07
648.91
(4,3)
(7,5)
-71.07
648.91
(5,3)
(7,5)
-71.07
648.91
(7,5)
(7,5)
-71.07
648.91
(8,5)
(7,5)
-71.07
648.91
La Tabla 5.4a contiene los resultados obtenidos al resolver el problema de minimización
del MSE_T , mientras que la Tabla 5.4b los resultados obtenidos al minimizar el MSE_V.
Tabla 5.4b: Soluciones finales al minimizar el MSE_V, Serie 1.
Solución Inicial Solución Final MSE_T MSE_V
(3,2)
(5,5)
-1.75
467.91
(6,4)
(5,5)
-1.75
467.91
(9,6)
(5,5)
-1.75
467.91
(4,3)
(5,5)
-1.75
467.91
(5,3)
(5,5)
-1.75
467.91
(7,5)
(5,5)
-1.75
467.91
(8,5)
(5,5)
-1.75
467.91
Observamos que al resolver de manera independiente cada uno de los problemas de
optimización partiendo de múltiples soluciones iniciales en ambos casos (Tabla 5.4a y
Tabla 5.4b) las diferentes soluciones convergían a una misma solución final. Con esto se
comprobaron las hipótesis de convexidad en los modelos y la existencia de optimalidad
global en cada una de las medidas de desempeño. Sin embargo, la solución óptima para
el MSE_T fue distinta a la que se obtuvo al minimizar el MSE_V. Para el primero, la
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
76
optimización nos llevó a un modelo de RNA con 7 datos históricos (lags) y 5 neuronas
en la capa oculta; para el segundo, el modelo de RNA con mejor desempeño fue aquél
en el que se consideraron 5 datos históricos y 5 neuronas en la capa oculta. Los
resultados obtenidos indican objetivos en conflicto.
Dada la importancia de obtener modelos de RNA con buena calidad de aproximación
y generalización, decidimos darle mayor importancia al MSE_V. Así que la solución
final fue la (5,5).
Ya que se tuvo la solución final, es decir los valores a los cuales debían ser ajustados
los parámetros, se construyó el modelo de RNA correspondiente para la realización del
pronóstico. Consideramos las seis diferentes inicializaciones de pesos en las conexiones
y seleccionamos la RNA con menor valor de MSE_V. En la Figura 5.7 se muestra el
pronóstico que se obtuvo con éste modelo de RNA, las medidas de desempeño tomaron
los valores siguientes:
MSE_T = 211.5056
y
MSE_V = 1431.77. Los pesos se
inicializaron en 0.5.
Real
RNA
Unidades de Demanda
800
700
600
500
400
300
200
100
0
1
7
13
19
25
31
37
43
49
55
61
67
73
79
Tiempo (meses)
Figura 5.7: Pronóstico del modelo de RNA definitivo, Serie 1.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
77
En la Figura 5.7 los primeros cuatro períodos del pronóstico pudieron ser comparados
contra datos de validación, esta comparación está contenida dentro del rectángulo en la
figura y los siguientes ocho períodos pronosticados indican la tendencia de la demanda
de acuerdo al modelo de RNA.
5.2.3. Análisis y Diseño de Experimentos para la Serie 2
Los parámetros o factores controlables que se consideraron en este caso fueron los
mismos que en la serie anterior: neuronas y lags, es decir k = 2 . La experimentación fue
planeada para variar lags en el rango [3,6] y neuronas en el rango [2,6]. Consideramos 3
niveles de cada uno de estos factores. Los valores específicos que se consideraron para
cada factor en su nivel correspondiente fueron: lags = {3, 4, 6} y neuronas = {2, 4, 6}.
Al llevar a cabo el experimento se consideró adecuado utilizar un diseño factorial de 32
con un total de 9 combinaciones factoriales para correr el modelo de RNAs.
Nuevamente, para cada combinación experimental de los niveles de los parámetros
construimos modelos de RNAs utilizando las seis inicializaciones descritas
anteriormente. De estas seis inicializaciones diferentes se seleccionó la RNA con mejor
valor en la medida de desempeño MSE_V y ésta fue la que se registró como resultado de
la combinación de los parámetros, así como el valor en el que fueron inicializados los
pesos de las conexiones de la misma. Los resultados del experimento se muestran en la
Tabla 5.5.
En la Tabla 5.5 las primeras dos columnas contienen el valor que tomó cada uno de
los factores (parámetros) para realizar la corrida del modelo de RNAs. La tercer y cuarta
columna contiene el valor que alcanzaron las medidas de desempeño de la RNA en el
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
78
entrenamiento y validación respectivamente, mientras que en la última columna se tiene
el valor en el cual fueron inicializados los pesos de las conexiones de la RNA.
Tabla 5.5: Resultados del experimento, Serie 2.
Lags
Neuronas
MSE_T
MSE_V
Inicio
3
2
82.57
339.73
- 0.5
3
4
61.02
304.30
-1
3
6
2016.10
1674.58
0
4
2
1769.86
2245.94
0
4
4
64.60
650.88
Aleatorio
4
6
1769.86
2245.94
0
6
2
105.31
259.71
Aleatorio
6
4
2003.33
1548.41
0
6
6
2003.33
1548.41
0
Los resultados detallados de cada uno de los modelos de RNAs resultantes
correspondientes a las combinaciones de los parámetros controlables están contenidos en
el Apéndice B3 el cual muestra el pronóstico que se obtuvo con cada uno de los
modelos de RNAs experimentales. Siguiendo la metodología del Capítulo 3, realizamos
la fase de metamodelación que se describe a continuación.
5.2.3.1. Metamodelación
Una vez realizado el experimento, se procedió a caracterizar los resultados mediante
el análisis de varianza con el fin de conocer la contribución que tenía cada uno de los
factores en las medidas de desempeño de la RNA. El modelo de regresión propuesto fue
el descrito en la Ecuación (3.1).
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
79
En la Tabla 5.6 se presentan los resultados que se obtuvieron del análisis de varianza
de los metamodelos correspondientes a las medidas de desempeño MSE_T y MSE_V.
Tabla 5.6: Resultados del análisis de varianza en las medidas de desempeño, Serie 2.
Variable de Regresión
MSE_T
P
MSE_V
P
Constante
-1107.73
0.909
-5703.14
0.471
x1
x2
1282.29
0.754
3753.74
0.289
-979.62
0.619
-969.18
0.534
-132.31
0.763
-413.03
0.278
145.38
0.513
137.80
0.435
31.36
0.874
19.72
0.898
x1
2
2
x2
x1 x2
R
R
2
50.90%
58.10%
0.00%
0.00%
2
ajustada
Como se observa en la Tabla 5.6, para el MSE de entrenamiento sólo un 50.9% de la
variación total es explicada con el modelo de regresión utilizado y para el MSE de
validación sólo un 58.1% de su variación se explica con el modelo. Es decir, los
coeficientes de determinación para ambas medidas de desempeño son muy bajos y los
valores de P asociados a los coeficientes del modelo no muestran significancia
estadística
Lo anterior nos llevó a concluir que si tratáramos de explicar la variabilidad
producida por cada factor en la medida de desempeño tomando como base estos
modelos de regresión, no se tendrían bases estadísticas fuertes que apoyaran nuestras
conclusiones. Así que de manera similar a la serie anterior, analizamos la superficie
experimental de las medidas de desempeño a través de gráficas de contorno y de
superficie, estas gráficas se muestran en la Figura 5.8.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
80
MSE_T
MSE_V
6
6
1500
1250
1000
5
Lags
Lags
5
750
4
4
500
1000
1500
500
3
2
3
4
5
6
3
2
3
4
Neuronas
5
6
Neuronas
2000
2000
MSE_V
MSE_T
1000
1000
6
0
0 2
5
4
2
4
Neuronas
6
3
Lags
Neuronas
4
6
3
4
5
6
Lags
Figura 5.8: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V
experimental en la Serie 2.
Empíricamente, fue posible ubicar una región en la cual las medidas de desempeño
resultaban pequeñas. De acuerdo a la Figura 5.8, para encontrar un MSE_T con valor
bajo el parámetro lags debía estar en el rango [3, 4] y el parámetro neuronas en el rango
[2, 4]. Sin embargo, para el MSE_V no fue tan fácil identificar el área con mejor
desempeño. Lo que observamos fue que cuando neuronas estaba en su nivel máximo la
medida de desempeño MSE_V alcanzaba valores muy altos para cualquier valor del
parámetro lags. Más aún, en las gráficas de superficie se observó que la curva descrita
por ambas medidas de desempeño era altamente no lineal en el área experimental y
tratar de aproximarla con una función cuadrática nos llevaría a tener poca confiabilidad
en la caracterización de los resultados. Por tal motivo, se identificó un área atractiva para
las medidas de desempeño que pudiera ser aproximada de manera adecuada mediante
una función cuadrática.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
81
De acuerdo con los resultados gráficos y el análisis de varianza, se observó
claramente que al utilizar 6 neuronas en la capa oculta los modelos de RNAs resultantes
tenían capacidad de aproximación y predicción baja.
Se redujo el área experimental como en el análisis de la serie anterior y esta vez se
realizó un nuevo experimento en el cual consideramos sólo aquéllas combinaciones
resultantes de
lags = {3, 4, 5, 6} y neuronas = {3, 4}. Resultó un total de 8
combinaciones factoriales, los resultados correspondientes están contenidos en la Tabla
5.7.
Tabla 5.7: Resultados del experimento enfocado, Serie 2.
Lags
Neuronas
MSE_T
MSE_V
3
3
94.41
245.40
Inicio
0.5
3
4
81.95
258.45
Aleatorio
4
3
87.02
249.19
-0.5
4
4
66.68
279.45
-1
5
3
106.29
131.62
-0.5
5
4
68.58
265.08
Aleatorio
6
3
91.31
255.49
[-1, 1]
6
4
66.83
536.79
1
Para resultados detallados acerca de los pronósticos que se obtuvieron con cada
modelo de RNA se sugiere ver el Apéndice B4 en el que se muestra el pronóstico que se
obtuvo con cada uno de los modelos de RNAs experimentales.
Una vez realizado el experimento en el área reducida, se procedió a caracterizar los
resultados mediante el análisis de varianza. Se partió del modelo de regresión descrito en
la Ecuación (3.1). La Tabla 5.8 contiene los resultados del análisis de varianza.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
82
Tabla 5.8: Resultados del análisis de varianza en las medidas de desempeño, Serie 2
(Experimento enfocado)
Variable de Regresión
MSE_T
P
MSE_V
P
Constante
103.467
0.437
2022.52
0.095
x1
x2
10.355
0.795
-698.25
0.078
0.296
0.992
-294.06
0.237
0.741
0.837
46.35
0.150
-5.343
0.433
90.80
0.125
x1
2
2
x2
x1 x2
R
R
2
82.40%
84.80%
59.00%
64.50%
2
ajustada
En la Tabla 5.8 los coeficientes de determinación son mayores del 80%, es decir que
los modelos de regresión fueron apropiados para describir buena parte de la variabilidad
existente en las medidas de desempeño registradas.
Las gráficas del análisis de las superficies de respuesta se muestran en la Figura 5.9.
En estas gráficas se observó que el MSE_T disminuyó conforme se incrementaba la
cantidad de neuronas en la capa oculta, mientras que el modelo de RNA perdía poder de
generalización pues el MSE_V iba en incremento.
Lo que destaca el punto anterior es de esperarse en el comportamiento de RNAs, pues
conforme la RNA se especializa en determinado patrón, el error de entrenamiento
disminuye considerablemente, mientras que el error de validación incrementa debido a
que es más difícil para la RNA descubrir nuevas relaciones en los patrones que jamás le
fueron mostrados durante el entrenamiento.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
MSE_T
MSE_V
6
6
83
400
300
200
5
Lags
Lags
5
4
3
80.0
4
70.0
3
4
3
3
4
Neuronas
Neuronas
500
100
400
MSE_T
90
MSE_V
300
80
200
6
6
70
5
5
4
3
Lags
4
3
3
3
Neuronas
4
Lags
Neuronas
4
Figura 5.9: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V
en la Serie 2 (experimento enfocado).
Con la Figura 5.9 se observó gráficamente que para ambas medidas de desempeño
era favorable utilizar aproximadamente 5 lags y se detectó la relación costo-beneficio
existente en las medidas de desempeño.
Los metamodelos obtenidos con la redefinición del área experimental fueron mucho
más confiables. Después se verificaron los supuestos de los modelos de regresión
mediante el análisis de residuos. Los resultados pueden consultarse en el Apéndice B5.
Una vez comprobados los supuestos, se prosiguió con la metodología, realizando la
optimización de las medidas de desempeño.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
84
5.2.3.2. Problemas de Optimización y Solución, Serie 2
Con la optimización, como ya se explicó anteriormente, se determina a qué valores
deben fijarse los parámetros experimentales con el fin de obtener un modelo de RNA
confiable. Puesto que el factorial resultante de la redefinición del área experimental
abarcó todas las combinaciones posibles en la nueva área y dado que sólo se
consideraron dos medidas de desempeño, la solución a estos problemas la realizamos de
manera gráfica. En la Figura 5.10, se muestra el comportamiento de las medidas de
desempeño registradas, el eje de las ‘x’ corresponde al MSE_V y el eje ‘y’ al MSE_T.
110
MSE_T
100
90
80
70
100
200
300
MSE_V
400
500
Figura 5.10: Gráfica del MSE_T vs MSE_V en la Serie 2.
Con los resultados mostrados en la Figura 5.10, lo que buscamos en un principio fue
minimizar el MSE_T y encontramos que la combinación de lags y neuronas que daba el
valor mínimo en ésta medida de desempeño era la combinación (4,4). Lo cual indicaba
que se debían utilizar 4 datos históricos o lags y 4 neuronas en la capa oculta.
Sin embargo, cuando resolvimos para minimizar el MSE_V encontramos que la mejor
solución era utilizar 5 lags y 3 neuronas en la capa oculta. Fue entonces cuando notamos
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
85
que existía conflicto en las medidas de desempeño, pues éstas convergieron a soluciones
diferentes.
Al existir conflicto en las medidas de desempeño, en la Figura 5.10 ubicamos la
frontera eficiente que representara el mejor compromiso en nuestras medidas de
desempeño. Esta frontera eficiente está determinada por la línea que aparece en la
gráfica. En esa frontera eficiente encontramos tres de nuestras combinaciones que
presentaron el mejor compromiso en nuestras medidas de desempeño, en la Tabla 5.9 se
presentan estas soluciones con sus valores correspondientes en las medidas de
desempeño utilizadas.
Tabla 5.9: Soluciones eficientes para el análisis de la Serie 2.
Lags
Neuronas
MSE_T
MSE_V
4
4
66.68
279.45
5
3
106.29
131.62
5
4
68.58
265.08
Observando los valores que tomaron las medidas de desempeño en cada una de las
soluciones mostradas en la Tabla 5.9, decidimos darle más importancia a la medida de
desempeño MSE_V. Así que en nuestro caso fue claro que la solución más atractiva era
aquélla en la que se utilizaban 5 lags y 3 neuronas en la capa oculta del modelo de RNA.
Por tanto, elegimos como solución final a esta última pues nos garantiza la obtención de
un modelo de RNA confiable con buena calidad de aproximación y poder de
generalización.
Ya que obtuvimos la solución final, se conoció el valor al cual debían ser ajustados
los parámetros y entonces se procedió con la construcción de la RNA correspondiente a
esta solución final para realizar el pronóstico. En la Figura 5.11 se muestra el pronóstico
que obtuvo el modelo de RNA definitivo cuyos parámetros fueron fijados de acuerdo al
resultado de la optimización.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
Real
86
RNA
Unidades de Demanda
250
200
150
100
50
0
1
7
13
19
25
31
37
43
49
55
61
67
73
79
Tiempo (meses)
Figura 5.11: Pronóstico del modelo de RNA definitivo para la Serie 2.
En la Figura 5.11 los primeros cuatro períodos del pronóstico pudieron ser
comparados contra datos de validación, el rectángulo muestra tal comparación y los
siguientes ocho períodos pronosticados indican la tendencia de la demanda de acuerdo al
modelo de RNA.
Para este caso se utilizaron las mismas herramientas computacionales que en el caso
del Capítulo 4.
Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos
87
5.3. Conclusiones
En este trabajo, se analizaron dos series de tiempo reales, que corresponden al
comportamiento de la demanda en una industria de telecomunicaciones. El análisis y
pronóstico de las mismas fue realizado mediante una RNA de múltiples salidas
construida mediante la aplicación de la metodología propuesta en el Capítulo 3. Se
obtuvieron modelos de RNA confiables, con pronósticos de calidad que en el Capítulo 6
serán comparados con pronósticos realizados mediante algunos modelos lineales
tradicionales.
Los resultados de este caso pueden ser reproducidos fácilmente aplicando la
metodología propuesta, inicializando los pesos de las conexiones de RNA
sistemáticamente y seleccionando de manera aleatoria de acuerdo a una distribución
uniforme sin reemplazo el conjunto de patrones de validación.
Tanto la inicialización como la selección del conjunto de validación son parte de la
contribución de esta tesis.
CAPÍTULO 6
COMPARACIÓN DE RESULTADOS
DE RNAs CONTRA MÉTODOS
LINEALES TRADICIONALES
Introducción
En este capítulo, se reportan los resultados del análisis de las series de tiempo
correspondientes a la demanda en la empresa de telecomunicaciones mediante la
utilización de algunos métodos lineales tradicionales tales como: método ingenuo,
método del promedio, promedios móviles, regresión lineal simple, suavizado
exponencial simple y suavizado exponencial doble. Este análisis fue llevado a cabo por
María Guadalupe Villarreal Marroquín durante un proyecto del Verano Científico
apoyado por el Provericyt -UANL (Proyecto PAICYT CA1069-05) con el fin de
sustentar los resultados obtenidos a través de la aplicación de RNAs para pronóstico de
series de tiempo.
88
Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales
89
Cabe destacar que la manera en que se analizaron las series de tiempo en los métodos
lineales utilizados estuvo acorde con los requerimientos propios de estos métodos. Por
tanto, el manejo de las series mediante RNAs fue hecho bajo consideraciones distintas.
Sin embargo, esta comparación resulta objetiva, pues el trabajo realizado mediante los
métodos lineales fue desarrollado de manera independiente al que se realizó con las
RNAs.
En la Sección 6.1, se presentan los resultados obtenidos al pronosticar mediante
modelos lineales el comportamiento de la demanda para un solo período, tomando como
base la serie presentada en la Figura 4.1. Dichos resultados fueron comparados con los
obtenidos a través del modelo de RNA desarrollado en el Capítulo 4. La Sección 6.2,
contiene los resultados de los modelos lineales utilizados en el pronóstico de la demanda
de doce períodos tomando como base las series mostradas en la Figura 5.1 y Figura 5.2
(analizadas en el Capítulo 5). Además, se incluye la comparación de los resultados de
los modelos de RNAs obtenidos en el Capítulo 5 contra el mejor resultado obtenido a
partir de los métodos lineales utilizados. Se observó que los modelos de RNAs
obtuvieron mejores resultados que los métodos lineales utilizados.
6.1.
Pronóstico
de
demanda
de
un
período
en
telecomunicaciones mediante métodos lineales tradicionales
Con el fin de aproximar la serie mostrada en la Figura 4.1 (Serie 1) y generar un
pronóstico para el siguiente período se utilizaron diferentes métodos lineales buscando
obtener un pronóstico de buena calidad para compararlo posteriormente con los
resultados obtenidos en el Capítulo 4. En dicho capítulo se desarrolló un modelo de
RNA mediante el ajuste de parámetros a través de técnicas estadísticas y de
optimización.
Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales
90
La Tabla 6.1 contiene los resultados obtenidos mediante métodos lineales. La
segunda columna contiene el valor del pronóstico, la tercera muestra el valor del MSE, la
cuarta el MAE, la quinta y sexta contienen el valor de S_Pred y B_Pred respectivamente.
Todas estas medidas se definieron previamente en el Capítulo 4.
Tabla 6.1: Resultados del análisis de la Serie 1 par el pronóstico de un solo período.
Método
Pronóstico
MSE
MAE
S_Pred
B_Pred
Método Ingenuo
424.000
850.894
16.864
126.000
78.000
Método Promedio
431.866
36814.707
168.041
7.985
327.943
Promedios Móviles n=5
546.000
2214.707
37.226
171.400
98.800
Promedios Móviles n=8
588.750
3657.836
50.506
192.500
113.500
Promedios Móviles n=10
598.300
4957.120
60.130
199.900
125.200
Suavizado Exponencial Simple
423.531
850.881
16.865
126.000
77.973
Regresion Lineal
740.353
4579.486
51.206
307.280
95.671
Suavizado Exponencial Doble
423.257
700.782
15.667
128.948
66.586
Analizando la Tabla 6.1, fue posible determinar cuál de los métodos utilizados tenía
mejor desempeño en la aproximación y pronóstico de la Serie 1. Sin lugar a duda, el
suavizado exponencial doble adquirió mejor valor en las medidas de desempeño
utilizadas. De esta manera, seleccionamos este método como el mejor de los métodos
lineales utilizados en el análisis de la Serie en cuestión. A continuación se describe la
comparación del modelo de RNA contra el Suavizado Exponencial Doble.
6.1.1. Comparación de Resultados
Los resultados obtenidos al utilizar el suavizado exponencial fueron comparados
contra los que se obtuvieron mediante el modelo de RNA que se construyó en el
Capítulo 4 para la Serie 1 (Figura 4.1), la Tabla 6.2 muestra tal comparación. El modelo
de RNA fue un modelo de tres capas entrenado por retropropagación del error, las
Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales
91
función de transferencia en la capa oculta fue la tangente hiperbólica (Ecuación 4.2) y
en la capa de salida fue la función identidad (Ecuación 4.3); los datos se manejaron en
escala [-1, 1] y se utilizaron como entrada las diferencias de la demanda registrada en los
últimos 6 períodos con 7 neuronas en la capa oculta y el algoritmo de entrenamiento fue
el lm.
Tabla 6.2: Modelo de RNA vs. Suavizado Exponencial Doble en el pronóstico de un
solo período, Serie 1.
Modelo
Suavizado Exponencial
Doble
RNA
Pronóstico
Real
MSE
MAE
S_Pred
B_Pred
423.257
424
700.78
15.66
128.94
66.58
424
424
0.80
1.68
4.68
5.04
Se pudo observar que existe una diferencia muy grande en cuanto a la calidad de
aproximación de la RNA y el método lineal. Por esta razón, la comparación favorece a la
RNA construida mediante la metodología propuesta para la selección de parámetros en
la serie de tiempo analizada.
La Figura 6.1 muestra de manera gráfica la comparación de los resultados de la Tabla
6.2. Se aprecia que en este caso de pronóstico de un solo período, la diferencia existente
entre el pronóstico de la RNA y el método de suavizado exponencial doble es pequeña,
sin embargo en los resultados para pronóstico de doce períodos este método resultó con
pobre desempeño como se verá en los resultados de la siguiente sección.
Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales
Suavizado Exp. Doble
RNA
Real
92
800
Unidades de Demanda
700
600
500
400
300
200
100
0
1
7
13
19
25
31
37
43
49
55
61
67
Tiempo (meses)
Figura 6.1: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en
el Análisis de la Serie 1, un solo período.
6.2.
Pronóstico
de
Demanda
de
n
períodos
en
telecomunicaciones mediante métodos lineales tradicionales
Cuando se desea pronosticar no sólo el siguiente período sino varios períodos
siguientes, existen también diversos métodos que permiten llevar a cabo la estimación
del comportamiento de la serie con un horizonte de pronóstico a largo plazo. En nuestro
caso, utilizamos el método de regresión lineal y el método de suavizado exponencial
doble. Ambos brindan la capacidad de calcular de manera directa el número de períodos
deseados en el horizonte de planeación. Los modelos fueron desarrollados para
pronosticar 12 períodos y la medida de desempeño utilizada para cuantificar la calidad
de aproximación de los modelos utilizados fue el MSE. Los resultados obtenidos durante
el análisis de la Serie 1 (Figura 5.1) se muestran en la Tabla 6.3. En la primer columna
se indica la técnica utilizada, la segunda columna contiene el valor de la medida de
desempeño MSE y las siguientes doce columnas contienen el pronóstico de la demanda
para los siguientes doce períodos de tiempo.
Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales
93
Tabla 6.3: Resultados del análisis de la Serie 1 para el pronóstico de 12 períodos.
Método
Método de Regresión
MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9
Mes
Mes
Mes
10
11
12
4579.4 740.3 749.4 758.4 767.5 776.6 785.7 794.7 803.8 812.9 822.0 831.0 840.1
Suavizado Exponencial Doble 700.7 413.2 370.5 327.8 285.1 242.4 199.6 156.9 114.2
71.5
28.8
-13.8 -56.5
Observando los resultados de la Tabla 6.3, en el análisis de la Serie 1 se concluyó que
el método con mejor desempeño fue el de suavizado exponencial doble, sin embargo,
viendo con mayor detenimiento los pronósticos que fueron estimados mediante esta
técnica, nos encontramos que para los meses 11 y 12 da como pronóstico valores
negativos. Estos resultados no tienen sentido en nuestro análisis, pues la serie analizada
representa el comportamiento de la demanda de un servicio. Lo que nos llevó a concluir
que el Suavizado Exponencial nos llevaría a resultados no deseados en el pronóstico de
la Serie 1 a largo plazo. Así que aunque el MSE del método de regresión era muy
grande, lo consideramos para propósitos de comparación.
Para analizar estadísticamente la Serie 2 correspondiente a la Figura 5.2, utilizamos
nuevamente las técnicas de regresión lineal y suavizado exponencial doble, en la Tabla
6.4 se muestran de manera detallada los resultados obtenidos.
Tabla 6.4: Resultados del análisis de la Serie 2, para el pronóstico de 12 períodos.
Método
Método de Regresión
MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9
Mes Mes Mes
10
11
12
541.70 164.8 167.1 169.3 171.6 173.8 176.0 178.3 180.5 182.8 185.0 187.3 189.5
Suavizado Exponencial Doble 221.5 96.2
97.8
99.3
100.9 102.4 104.0 105.6 107.1 108.7 110.2 111.8 113.3
Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales
94
Analizando los resultados de la Tabla 6.4, se optó por elegir el método de suavizado
exponencial doble, pues resultó con un MSE menor que el método de regresión y los
valores de pronóstico fueron razonables para el análisis de la Serie 2.
6.2.1. Comparación de Resultados
Considerando un horizonte de planeación de 12 periodos, en el Capítulo 5 fueron
construidos modelos de RNAs con múltiples salidas para pronosticar doce valores de
demanda mediante el análisis de las Series 1 y 2 (Figura 5.1 y Figura 5.2
respectivamente).
En la Tabla 6.5 se muestra la comparación de los resultados obtenidos. La segunda
fila contiene los resultados obtenidos mediante el método lineal, la tercera contiene los
que se obtuvieron a partir del modelo de RNA y en la última fila están valores reales de
la demanda que se registró en los cuatro períodos posteriores al último dato contenido en
la Serie 1 (ver Figura 5.1). Estos últimos fueron brindados por la empresa, con el fin de
validar los resultados de ambas técnicas: RNAs y métodos lineales tradicionales. En la
Figura 6.2 se presentan los resultados de esta comparación de manera gráfica.
Tabla 6.5: Modelo de RNA vs Método Tradicional vs Modelo Real en el análisis de la
Serie 1.
Método
MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9
Mes Mes Mes
10
11
12
Método de Regresión 4579.4 740.3 749.4 758.4 767.5 776.6 785.7 794.7 803.8 812.9 822.0 831.0 840.1
RNA
Real
211.5 528.4 540.6 555.7 566.4 584.4 599.7 609.2 614.2 627.5 638.4 653.8 675.2
455.0 458.0 465.0 472.0
Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales
95
Se puede observar que los resultados obtenidos mediante el modelo de RNA para el
análisis y pronóstico de 12 períodos de la Serie 1 construido a partir de la metodología
propuesta nos condujo a mejores resultados que el mejor de los métodos lineales
utilizados.
Real
RNA
Método de Regresión
900
Unidades de Demanda
800
700
600
500
400
300
200
100
0
1
7
13
19
25
31
37
43
49
55
61
67
73
79
Tiempo (meses)
Figura 6.2: Comparación del pronóstico de RNAs vs. Método de Regresión en el
Análisis de la Serie 1, doce períodos.
A continuación en la Tabla 6.6 se muestra de manera semejante a la anterior los
resultados obtenidos a través de los diferentes métodos durante el análisis de la Serie 2 y
en la Figura 6.3 se presentan en forma gráfica.
Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales
96
Tabla 6.6: Comparación de Resultados, Modelo de RNA vs Método Tradicional vs
Modelo Real, Serie 2.
Método
MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9
Suavizado Exponencial Doble 221.5 96.2
97.8
99.3
100.9 102.4 104.0 105.6 107.1 108.7 110.2 111.8 113.3
RNA
106.2 157.6 163.3 162.2 164.3 165.1
Real
150.0 149.0 151.0 155.0
166
173.0 176.3 185.9 191.0 106.2 157.6
Suavizado Exp. Doble
RNA
Real
Mes Mes Mes
10
11
12
800
Unidades de Demanda
700
600
500
400
300
200
100
0
1
7
13
19
25
31
37
43
49
55
61
67
73
79
Tiempo (meses)
Figura 6.3: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en
el Análisis de la Serie 2, doce períodos.
Nuevamente, los resultados obtenidos mediante el modelo de RNA para el análisis y
pronóstico de 12 períodos de la Serie 2, son mejores que los de los métodos lineales
utilizados.
Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales
97
6.3. Conclusiones
Al realizar la comparación de los modelos de RNAs construidos a través de la metodología
propuesta en el Capítulo 3 comprobamos que para nuestro caso de estudio de pronóstico de
demanda de telecomunicaciones para uno y doce periodos futuros, los modelos de RNA
permitieron obtener pronósticos mucho más confiables que los obtenidos mediante métodos
lineales tradicionales. Lo anterior, sustenta la validez del método propuesto.
CAPÍTULO 7
INSTAURACIÓN DE LA
HERRAMIENTA DE SOPORTE A LA
TOMA DE DECISIONES
Introducción
En este capítulo se explica de manera general la implementación computacional que
se llevó a cabo en el desarrollo de la metodología descrita en el Capítulo 3. La
herramienta que se presenta en la Figura 7.1, fue creada y utilizada para generar y
ejecutar el diseño de experimentos de RNAs para el pronóstico de múltiples períodos.
Al implementar dicha herramienta se obtuvieron grandes beneficios, pues no es
necesaria la interacción del usuario durante la ejecución del experimento y su
intervención se limita a proporcionar la delimitación del área experimental, así como los
valores de la serie de tiempo.
98
Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones
99
La codificación fue realizada en Matlab 7.0.4. A continuación se presenta la
descripción general de la herramienta y el código fuente está disponible en el Apéndice
C. La fase de análisis de varianza y optimización se realizó en Minitab y Excel Solver
respectivamente.
7.1. Descripción de la herramienta de soporte a la toma de
decisiones
El objetivo de la codificación de la herramienta de soporte de decisiones fue brindarle
al tomador de decisiones una herramienta que sustente y oriente las decisiones de
planeación de capacidad de una red de transmisión, sin necesidad de conocer a detalle la
modelación mediante RNAs para pronóstico de series de tiempo. Se llevó a cabo la
construcción de un prototipo que se encarga de generar y ejecutar un diseño de
experimentos de tipo factorial (Figura 7.1) que constituye la parte fundamental de la
metodología propuesta en el Capítulo 3.
Para ejecutar el proceso de la Figura 7.1 el usuario requiere especificar las siguientes
entradas:
•
Datos: Corresponde a los valores de la demanda registrados a lo largo del tiempo
(serie de tiempo). Se especifica en forma de vector columna o bien, se da el
nombre del archivo .xls o .m que contiene tal vector. Este archivo debe estar en
el espacio de trabajo actual.
•
Especificaciones de los factores: En nuestro caso, los factores que formarán parte
del diseño de experimentos son lags y neuronas. Así que es necesario introducir
los valores específicos que toman estos factores en cada uno de los niveles
definidos dentro del rango experimental.
•
Resultados: Corresponde al nombre de un archivo .xls en el cual se almacenará
en forma de tabla los resultados del experimento.
Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones
Datos
Especificaciones
de los factores
100
Resultados
Generar Combinación Factorial
Selección del Conjunto de Validación
Inicialización de la RNA
Entrenamiento de la RNA
Validación de la RNA y Pronóstico
Guardar RNA y
medidas de desempeño
¿Otro punto de
inicio?
Sí
No
Selección del mejor modelo de RNA
Mostrar
Resultados
No
Guardar en Resultados
¿Factorial
Completo?
Si
Terminar
Figura 7.1: Generador y ejecutor de un Experimento Factorial.
Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones
101
Por ejemplo, si la serie de datos está contenida en un archivo llamado ‘Serie.m’ y el
experimento se desarrollará con tres niveles de cada factor con valores específicos de
lags = {2, 5, 7} y neuronas= {3, 5, 8} y se quiere almacenar los resultados en el archivo
‘salida.xls’. Se introduce en la línea de comandos: Hacer_Experimento(Serie, [2 5 7],[3
5 8], ‘salida.xls’)
De esta forma, el programa Hacer_Experimento realiza lo siguiente:
•
Generar combinación factorial: Fija el factor lags en un nivel y recorre cada uno
de los niveles de neuronas. Cuando se han recorrido todos los niveles de
neuronas, entonces se recorre el factor lags al siguiente nivel y vuelve a recorrer
neuronas. Se realiza sucesivamente hasta terminar las posibles combinaciones de
los factores. Cuando se tiene una combinación factorial, se procede a preprocesar los datos de manera que estén contenidos en la región [-1, 1]. Se lleva a
cabo la construcción de patrones cuya cantidad dependerá de la cantidad de datos
contenidos en ‘Serie’, el número de lags y la cantidad de salidas de la RNA (que
en nuestro caso son 12). Ya que se tienen todos los patrones disponibles para el
análisis, se separan en dos conjuntos: conjunto de entrenamiento y conjunto de
validación, para llevar a cabo la técnica de validación cruzada.
•
Selección del conjunto de validación: Puesto que ya se conoce la cantidad de
patrones disponibles, se selecciona de manera aleatoria de acuerdo a una
distribución uniforme sin reemplazo aquéllos patrones que formarán parte del
conjunto de validación. En nuestro caso usamos aproximadamente el 30% de los
patrones disponibles. Los patrones no seleccionados conformarán el conjunto de
entrenamiento.
El programa Selección, es el que se encarga de construir las matrices de
entrenamiento y de validación del modelo de RNA. En este momento ya se tiene
información suficiente que permite comenzar el proceso de construcción del modelo de
RNA. Se utiliza una RNA de tres capas con retropropagación con función de
transferencia tangente hiperbólica en la capa oculta y función identidad en la capa de
salida. La RNA se construye como sigue:
Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones
•
102
Inicialización de la RNA: Fija los valores iniciales de las conexiones de la RNA.
Como se explicó en el Capítulo 5, en nuestro caso tenemos 7 puntos de inicio
para la RNA, así que se inicializa en cada uno de ellos para llevar a cabo su
entrenamiento y validación. Posteriormente se seleccionará la RNA con mejor
desempeño.
•
Entrenamiento: La actualización de las conexiones se realizará mediante el
algoritmo de Levenberg - Marquardt (lm), para minimizar el error de
aproximación conocido como MSE. Se consideran sólo los patrones del conjunto
de entrenamiento con el objetivo de minimizar la función de error, para obtener
una buena aproximación del modelo que está detrás del comportamiento de los
datos. Terminada la actualización de pesos, se realiza el post- procesamiento de
la información para calcular la medida de desempeño MSE_T, correspondiente a
la RNA.
•
Validación y Pronóstico: Considerando los patrones del conjunto de validación,
se alimenta a la RNA resultante del entrenamiento anterior. Obtenemos las
salidas de la RNA, post-procesamos las salidas y calculamos el MSE_V. Para
realizar el pronóstico consideramos los últimos datos históricos (pre procesados) registrados en la Serie de acuerdo al valor del factor lags, los
alimentamos a la RNA y calculamos las salidas de la RNA. Llevamos a cabo el
post- procesamiento para obtener así el pronóstico de los siguientes 12 períodos.
•
Guardar RNA y medidas de Desempeño: Se almacenan en archivos temporales
los resultados del entrenamiento, validación y pronóstico. Posteriormente se
recurrirá a ellos para obtener sólo el que contenga la RNA con mejor desempeño,
el resto de los archivos será depurado.
•
¿Otra inicialización?: Puesto que tenemos 7 puntos de inicio para los modelos de
RNA, si aún no se han construido los 7 modelos diferentes de RNA para la actual
combinación de factores, se procede a la inicialización de la RNA en otro punto
distinto. De lo contrario, se procede al siguiente paso:
•
Selección del mejor modelo de RNA: De los modelos correspondientes a la
combinación actual de factores, se selecciona el modelo de RNA con menor
MSE_V, así obtenemos el modelo de RNA con mayor poder de generalización
Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones
103
para esa combinación de factores. Se eliminan los archivos temporales y se
conserva sólo el que contiene el modelo de RNA seleccionado.
•
Mostrar Resultados: Despliega en pantalla un gráfico que contiene los datos
históricos de la demanda, así como el pronóstico obtenido por el modelo
seleccionado.
•
Guardar en Resultados: Actualiza el archivo ‘salida.xls’, coloca la combinación
de factores, el valor de las medidas de desempeño correspondientes a esa
combinación así como el valor del pronóstico para los siguientes 12 períodos del
modelo seleccionado.
•
¿Factorial Completo?: Si aún no se han elaborado modelo de RNA con todas las
combinaciones posibles de lags y neuronas, se procede a Generar Combinación
Factorial, de lo contrario el procedimiento termina.
•
Terminar: Concluye la ejecución del experimento.
Al finalizar, el tomador de decisiones tendrá disponible el archivo ‘salida.xls’ que
contiene los resultados del experimento. De acuerdo a la metodología, se procede a la
caracterización de resultados mediante el análisis de varianza. Se obtienen los
metamodelos para llevar a cabo la optimización de las medidas de desempeño de la
RNA, así se determina el valor al cual deben fijarse los parámetros para que la RNA
brinde pronósticos confiables.
El análisis de varianza se puede ejecutar en cualquier paquete estadístico, en nuestro
caso se utilizó Minitab. La optimización de los modelos de RNA resultantes se puede
realizar en cualquier herramienta de optimización no lineal entera, el solver de Excel
fue suficiente para el propósito de este trabajo.
Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones
104
7.2 Conclusiones
Con la automatización del generador y ejecutor de experimentos, el usuario lo único
que tiene que hacer es brindar la información histórica de la serie y especificar los
valores de los parámetros, el resto de las decisiones las toma el programa. Por tanto, es
una herramienta muy sencilla de manejar que no exige conocimiento previo acerca de la
modelación de series de tiempo mediante RNAs. Queda al usuario crear los
metamodelos y llevar a cabo la optimización. Estos procedimientos pueden
automatizarse en un futuro considerando la salida de la codificación aquí descrita.
CAPÍTULO 8
CONCLUSIONES, CONTRIBUCIÓN Y
TRABAJO FUTURO
En este trabajo, se propuso una metodología para seleccionar los parámetros que
intervienen en la construcción y utilización de RNAs para pronóstico de series de
tiempo. La metodología propuesta utiliza conceptos de diseño de experimentos, análisis
de varianza, y optimización no lineal. Se pudo demostrar que la metodología trabaja
bien por medio de un caso práctico de predicción de demanda en la industria de las
telecomunicaciones. Dentro de las características atractivas de la metodología se
encuentra que: (1) utiliza técnicas establecidas y confiables, (2) puede instaurarse sin
necesidad de una codificación especializada y (3) hace entendible la interrelación entre
los varios parámetros de la RNA.
Se analizaron dos series de tiempo reales que corresponden al comportamiento de la
demanda en una industria de telecomunicaciones. El análisis y pronóstico de las mismas
fue realizado mediante una RNA de múltiples salidas construida mediante la aplicación
de la metodología propuesta. Se obtuvieron modelos de RNA confiables, con
105
Capítulo 8. Conclusiones, Contribución y Trabajo Futuro
106
pronósticos de calidad que fueron comparados con pronósticos realizados mediante
procedimientos lineales tradicionales y valores reales.
Al realizar la comparación de los modelos de RNAs construidos a través de la metodología
propuesta, comprobamos que para nuestro caso de estudio de pronóstico de demanda de
telecomunicaciones para uno y doce periodos futuros, los modelos de RNA permitieron obtener
pronósticos mucho más confiables que los obtenidos mediante métodos lineales tradicionales.
Estos resultados sustentan la validez del método propuesto.
La metodología propuesta tiene la ventaja de permitir reproducir los resultados
fácilmente aplicándola de manera sistemática, inicializando los pesos de las conexiones
de RNA en los valores propuestos y seleccionando de manera aleatoria de acuerdo a una
distribución uniforme sin reemplazo el conjunto de patrones de validación.
Se automatizó el generador y ejecutor de experimentos haciendo aún más sencilla la
construcción del modelo de RNA. El usuario lo único que tiene que hacer es brindar la
información histórica de la serie y especificar los valores de los parámetros, el resto de
las decisiones las toma el programa. Por tanto, es una herramienta muy sencilla de
manejar que no exige conocimiento previo acerca de la modelación de series de tiempo
mediante RNAs.
La principal contribución de esta tesis fue la metodología propuesta, pues hasta
donde tenemos conocimiento nunca ha sido aplicada para la selección de parámetros de
una RNA. Además, se resolvió un problema real de una empresa de telecomunicaciones.
Otra característica atractiva es la inicialización sistemática de los pesos de las
conexiones pues brinda la posibilidad de reproducir los resultados. Por otra parte, la
forma en que fue seleccionado el conjunto de validación es provechosa y objetiva, ya
que al ser de manera aleatoria, el diseñador del modelo no influye en la selección de los
patrones que se utilizarán para probar la capacidad de generalización de la RNA.
En el desarrollo del modelo de RNAs para pronóstico de múltiples períodos
obtuvimos resultados empíricos que mostraron un pobre desempeño de la técnica
iterativa que utiliza RNAs con una salida para pronosticar más de un período. También
Capítulo 8. Conclusiones, Contribución y Trabajo Futuro
107
se obtuvo pobre desempeño en la técnica que usa modelos de RNA independientes para
cada horizonte de pronóstico con el fin de pronosticar múltiples períodos. De acuerdo a
lo anterior, concluimos que para el pronóstico de múltiples períodos es mejor utilizar
modelos de RNAs con múltiples salidas. Por supuesto, queda abierta esta línea de
demostrar teóricamente estas conclusiones.
Como trabajo futuro se pueden encontrar intervalos de confianza para los pronósticos
que se obtienen mediante el modelo de RNA construido a través de la metodología
propuesta.
Sería además interesante utilizar la metodología propuesta con diferentes tipos de
RNAs.
Otra extensión potencial de este trabajo es la automatización de los procesos de
análisis de varianza y optimización.
BIBLIOGRAFÍA
Al-Saba Tawfiq and El-Amin Ibrahim, “Artificial neural networks as applied to
long-term demand forecasting”, Artificial Intelligent in engineering, Vol. 13, 1999,
pp. 189-197.
Ashu Jain, Ashish Kumar, and Umesh Chandra Joshi, “Short-Term Water
Demand Forecast Modelling at IIT Kanpur Using Artificial Neural Networks”,
Water Resources Management Vol. 15, Num.5 , 2001, pp. 299-321.
Bishop C. M., Neural networks for pattern recognition. Oxford University Press,
Oxford, UK, 1995.
Borwein J. M., and Lewis A. S., Convex Analysis and Nonlinear Optimization,
Springer, Verlag-New York, Inc, 2000.
Box G. E. P., and Jenkins G. M., Time series Analysis: Forecasting and control,
San Francisco, CA: Holden-Day, EUA, 1976.
Cabrera-Ríos M., Castro J. M., and Mount-Campbell C. A., “Multiple quality
criteria optimization in in-mold coating (IMC) with a data envelopment analysis
approach”, Journal of Polymer Engineering, Vol. 22, No. 5, 2002, pp. 305- 340.
Cabrera-Ríos M., Castro J. M., and Mount-Campbell C. A., “Multiple quality
criteria optimization in reactive in-mold coating with a data envelopment analysis
approach II: a case with more than three performance measures”, Journal of Polymer
Engineering, Vol. 24, No. 4, 2004, pp. 435-450.
108
Bibliografía
109
Castro C. E., Cabrera-Ríos M., Lilly B., Castro J. M., and Mount-Campbell C.
A., “Identifying the best compromise between multiple performance measures in
injection holding (IM) using data envelopment analysis (DEA)”, Journal of
Integrated Design and Process Science, Vol. 7, No. 1, 2003, pp. 77-87.
Castro J. M., Cabrera-Ríos M., and Mount-Campbell C. A., “Modelling and
Simulation in reactive polymer processing”, Modelling and Simulation in Materials
Science and Engineering, Vol. 12, No. 3, 2004, pp. S121-S149.
Cigizoglu H. Z., “Incorporation of ARMA models into flow forecasting by artificial
neural networks”, Environmetrics, Vol. 14, Num. 4, 2003, pp. 417-427.
Cybenko G., “Approximation by superpositions of sigmoidal function”,
Mathematical Control Signals Systems, Num. 2, 1989, pp.303-314.
Daliakopoulos Ioannis N., Coulibaly Paulin, and Tsanis Ioannis K.,
“Groundwater level forecasting using artificial neural networks”, Journal of
Hydrology, Vol. 309, Num. 1-4, 2005, pp. 229-240.
Deb K., Multi-Objective Optimization using evolutionary algorithms, Editorial
Wiley, N.Y., EUA, 2004.
Devore J. L., Probability and Statistics for Engineering the Sciences 4ta Edición,
Duxbury Press, California Polytechnic State University, EUA, 1995.
Duhoux M, Suykens JAK, De Moor B, and Vandewalle J, “Improved long-term
temperature prediction by chaining of neural networks”, Int J Neur Sys, Vol. 11, No.
1, 2001, pp. 1-10.
Floudas C. A., Nonlinear and Mixed- Integer Optimization, Oxford, N.Y., 1995.
Gardner M. W., and Dorling S. R., “Artificial neural networks (the multi-layer
perceptron)- a review of applications in the atmospheric sciences”, Atmospheric
Environment, Vol. 33, 1999, pp. 709-719.
Bibliografía
110
Ghaziri Hassan M., Optimización Heurística y Redes Neuronales, Editado por Díaz
Fernández Adenso, Madrid, España, 1996.
Ghiassi M., and Saidane H., “A dynamic architecture for artificial neural
networks”, Neurocomputing, Vol. 63, 2005, pp. 397-413.
González Pedro, and Zamarreño Jesús, “Prediction of hourly energy consumption
in buildings based on a feedback artificial neural network”, Energy and Building,
Vol. 37, 2005, pp. 595-601.
Granger C. W. J., “Strategies for modelling nonlinear time-series relationships”,
The Economic Record, Vol. 69, Num. 206, 1993, pp. 233-238.
Gutiérrez-Estrada Juan C., De Pedro-Sanz Emiliano, López-Luque Rafael and
Pulido-Calvo Inmaculada, “Comparation between tradicional methods and
artificial neural networks for ammonia concentration forecasting in an eel (Anguilla
anguilla L.) intensive rearing system”, Aquacultural Engineering, Vol. 31, 2004, pp.
183-203.
Hagan M. T., Demuth H. B., and Beale M., Neural network design, PWS Publising
Company, EUA, 1996.
Hanh H. Nuguyen and Christine W. Chan, “Multiple neural networks for a long
time series forecast”, Neural Comput &Applic, Vol. 13, 2004, pp. 90-98.
Hansen J. V., and Nelson R. D., “Forecasting and recombining time-series
components by using neural networks”, Journal of the Operations Research Society,
No. 54, 2003, pp. 307-317.
Hill, T., W. Remus, and M. OπConnor, "Neural Network Models for Time Series
Forecasts", Management Science, Vol. 42, Num. 7, 1996, pp. 1082-1092.
Hillermeier C., Nonlinear Multiobjective Optimization: a generalized homotopy
approach, Basel: Birkhauser Verlag, 2001.
Bibliografía
111
Hornik K., Stinchcombe M., and White H.,“Multilayer feedforward networks are
universal approximators”, Neural Networks, Vol. 2, No. 5, 1989, pp. 359-366.
Hu M. J. C., “Application in the Adaline system to weather forecasting”, Master
Thesis, Technical Report 6775-1, Stanford electronic Laboratories, Stanford, CA,
Junio de 1964.
Huang W., Xu B., and Chan-Hilton A., “Forecasting flows in Apalachicola River
using neural networks”, Hydrological Processes, Vol. 18, 2004, pp. 2545-2564.
Hwarng H. B., “Insights into neural-network forecasting of time series
corresponding to ARMA (p,q) structures”, Omega: The International Journal of
Management Science, Vol. 29, No. 3, 2001, pp. 273-289.
Irie B., and Miyake S., “Capabilities of three-layered perceptrons”, Proccedings of
the IEEE International Conference on Neural Networks I, 1988, pp. 641-648.
Kolehmainen M., Martikainen H., Russkanen J., “Neural networks and periodic
components used in air quality forecasting“, Atmospheric Environment, Vol. 35,
2001, pp. 815-825.
Liao K-P, and Fildes R., “The accuracy of a procedural approach to specifying
feedforward neural networks for forecasting”, Computers & Operations Research,
Vol. 32, No. 2, 2005, pp. 151-2169.
Luenberger D. G., Introduction to linear and nonlinear optimization programming,
Addison- Wesley Publishing Company, 1973.
Maier H. R., and Dandy G. C., “Neural networks for the prediction and forecasting
of water resources variables: a review of modelling issues and applications”,
Environment Modelling & Software, Vol. 15, 2000, pp. 101-124.
Makridakis S., and Wheelwright S. C., The handbook of forecasting a manager’s
guide, Segunda edición, Editorial Wiley, N.Y., EUA 1987.
Bibliografía
112
Makridakis S., Anderson A., Carbone R., Fildes R., Hibbon M., Lewandowski
R., Newton J., Parsen E., and Winkley R., “The accuracy of extrapolation (time
series) methods: Results of a forecasting competition”, Journal of Forecasting, Vol.
1, 1982, pp. 111-153.
Martínez Martínez Garza Ángel, Diseños Experimentales: métodos y elementos de
teoría, Editorial Trillas, México, 1988.
McCulloch W. S., and Pitts W., “A logical calculus of the ideas imminents in
nervous activity ”, Bulletin and Mathematical Biophysics, Vol. 5, 1943, pp. 115133.
Medeiros M. C., and Pedreira C. E., “What are the effects of forecasting linear
time series with neural networks”, Logistic and Transportation Review, Vol. 31, No.
3, 2001, pp. 239-251.
Montgomery Douglas C., Diseño y Análisis de Experimentos, Segunda Edición,
Editorial Limusa Wiley, México D. F., 2004.
Nelson, M., T. Hill, W. Remus and M. O'Connor, "Time Series Forecasting Using
Neural Networks: Should the Data Be Deseasonalized First?", Journal of
Forecasting, 1999, Vol.18, Num.5, pp. 359-370.
Niska Harri, Hiltunen Teri, Karppinen Ari, Russkanen J. and Kolehmainen M.,
“Evolving the neural network model for forecasting air pollution time series”,
Engineering Applications of Artificial Intelligence, Vol. 17, 2004, pp. 159-167.
Piramuthu S., H. Ragavan, and M. Shaw, “Using feature construction to improve
the performance of neural networks”, Management Science, Vol. 44, No. 3, 1998,
pp. 416-430.
Qi Min and Zhang G. P., “An investigation of model selection criteria for neural
network time series forecasting”, European Journal of Operation Research, Vol.
132, 2001, pp. 666-680.
Bibliografía
113
Qing Cao, Karyl B. Leggio and Marc J. Schniederjans, “A comparation between
Fama and Frech’s model and artificial neural networks in predicting the Chinese
stock market”, Computers & Operation Research, Vol. 32, 2005, pp. 2499-2512.
R. J. Kuo and k. C. Xue, “Fuzzy neural networks with application to sales
forecasting”, Fuzzy sets and y systems, Vol. 108, Num. 2, 1999, pp. 123-143.
Rumelhart D-E., Hinton G. E., and Willians R. J., “Learning representartions by
backpropagating errors”, Nature, 323 (6188), 1986, pp. 533-536.
Sexton R. S., McMurtrey S., Michalopoulos J. O., and Smith A. M.,“Employee
turnover : a neural network solution”, Computers & Operations Research, Vol. 32,
No. 10, 2005, pp. 2635-2651.
Smith K. A. and Gupta JND, “Neural networks in business: techniques and
applications for the operations researcher”, Computers and Operations Research,
Vol. 27, Num. 11-12, 2000, pp.1023-1044.
Sözen Adnan, Arcaklioglu Erol, Özalp Mehmet, and Çaglar Naci, “Forecasting
based neural network approach of solar potential in Turkey”, Renewable Energy,
Vol. 30, Num.7, 2005, pp. 1075-1090.
Werbos P. J., “Generalization of backpropagation with applications to a recurrent
gas market model”, Neural Networks, Vol. 1, 1988, pp. 339-356.
West D., Dellana S., and Qian J., “Neural networks strategies for financial decision
applications”, Computers & Operations Research, Vol. 32, 2005, pp.2543-2559.
White H., “Connectionist nonparametric regression: Multilayer feedforward
networks can learn arbitrary mappings”, Neural Networks, Vol. 3, No. 5, 1990, pp.
535-549.
Bibliografía
114
Widrow B., Rumelhart D., and Lehr M. A., “Neural networks: Applications in
industry, bussines and science”, Communications of the ACM, Vol. 37, No. 3, 1994,
pp. 93-105.
Zhang G. P., and Hu M. Y., “A simulation study of artificial neural networks for
nonlinear time series forecasting”, Computers & Operations Research, Vol. 28,
2001, pp. 381-396.
Zhang G. P., Neural Networks in Business Forecasting, Idea Group Publishing,
Georgia State University, EUA, 2004.
Zhang G., Patuwo E., and Hu Y. M., “Forecasting with artificial neural networks
the state of the art”, International Journal of Forecasting, Vol.14, No. 1, 1998, pp.
35-62.
LISTA DE FIGURAS
1.1. Descripción del problema de Telecomunicaciones. ………...…………………..
2
1.2: Ejemplo de una Serie de Tiempo. ………....………………………………….….
3
2.1: Neurona Biológica. ………………………………………...…………………..
10
2.2: Neurona Artificial. ………...…………………………………………………....
11
2.3: RNA multicapa de propagación hacia adelante. ………...……………...……..
12
2.4: Modelo general de un proceso o sistema. ………...……………………...……..
21
2.5: a) Función convexa y b) Función estrictamente convexa. ...…………………..
25
2.6: Función no convexa. ………...……………………………………………..…..
25
2.7: Representación Gráfica de un Problema de Optimización Multicriterio. ……...
27
3.1: Metodología Propuesta para la Selección de Parámetros en RNAs. …………..
30
4.1: Serie de tiempo del comportamiento de la demanda. ………………….………
39
4.2: Red Neuronal
Artificial de propagación hacia adelante, entrenada por
retropropagación del error de pronóstico, con tres capas. ………...…………..……
41
4.3: Gráficas para comprobación de normalidad e independencia estadística de los
residuos en el modelo de regresión de la B_Pred. ………...………………………...
115
51
Lista De Figuras
116
4.4: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza en
los residuos del modelo de regresión de la B_Pred. ………...………………….…..
52
4.5: Modelo de RNAs vs Modelo Real. ………...…………………………………..
55
5.1: Comportamiento de la demanda, Serie 1. …..……...…………………………..
59
5.2: Comportamiento de la demanda, Serie 2. ………...…………………….……...
60
5.3: Red neuronal
artificial de propagación hacia adelante, entrenada por
retropropagación del error de pronóstico con tres capas y múltiples salidas. ……...
62
5.4: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V
experimental en la Serie 1. ………...……………………………………...………..
69
5.5: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V en el
experimento enfocado. ………...…………………………..……………...………..
72
5.6: Superficie de los metamodelos para el MSE_T y MSE_V antes y después del
enfoque del Experimento. ………...……………………………………...………....
73
5.7: Pronóstico del modelo de RNA definitivo, Serie 1. ………...………………....
76
5.8: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V
experimental en la Serie 2. ………...……………………………………...………..
80
5.9: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V en la
Serie 2 (experimento enfocado). …...……………………………………...………..
83
5.10: Gráfica del MSE_T vs MSE_V en la Serie 2. ………………………..………..
84
5.11: Pronóstico del modelo de RNA definitivo para la Serie 2. …….…………….
86
6.1: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en el
Análisis de la Serie 1, un solo período. …………………………………...………..
92
Lista De Figuras
117
6.2: Comparación del pronóstico de RNAs vs. Método de Regresión en el Análisis de la
Serie 1, doce períodos. ……………..……………………………………...………..
95
6.3: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en el
Análisis de la Serie 2, doce períodos. ……………………...……………...………..
7.1: Generador y ejecutor de un Experimento Factorial ……………………...….
96
100
APÉNDICES
A21: Gráficas para comprobación de normalidad e independencia estadística de los
residuos en el modelo de regresión de S_Pred. …………………………………...
139
A22: Gráficas para comprobación de normalidad e independencia estadística de los
residuos en el modelo de regresión del MAE. ……………..……………………...
139
A23: Gráficas para comprobación de normalidad e independencia estadística de los
residuos en el modelo de regresión del MSE. ………………………………….....
140
A24: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza
en los residuos del modelo de regresión de la S_Pred. …………………………...
141
A25: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza
en los residuos del modelo de regresión del MAE. ……………………………......
142
A26: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza
en los residuos del modelo de regresión del MSE. ….…………………...………..
143
B21: Gráficas de Residuos para el MSE_T, Serie 1. ………..…………...………..
151
B22: Gráficas de Residuos para el MSE_V, Serie 1. ………..…………...………..
151
Lista De Figuras
118
B23: Gráficas de residuos contra variables, Serie 1. ...……..…………...………...
152
B24: Resultados del análisis formal de normalidad en los residuos, Serie 1. ….…
153
B51: Gráficas de Residuos para el MSE_T, Serie 2. ……..……………..………...
157
B52: Gráficas de Residuos para el MSE_V, Serie 2. ……..……………..………...
157
B53: Gráficas de residuos contra variables, Serie 2. ……..……………..………...
158
B54: Resultados del análisis formal de normalidad en los residuos, Serie 2.
159
…..
LISTA DE TABLAS
4.1: Resultados del experimento. …………………………………………………...
46
4.2: Resultados del análisis de varianza para cada medida de desempeño. …..……
49
4.3: Mejores soluciones encontradas. ……………………………………………....
54
5.1: Resultados del experimento de la Serie 1. ………………………………....…..
66
5.2: Resultados del análisis de varianza en las medidas de desempeño, Serie 1. …..
68
5.3: Resultados del análisis de varianza en las medidas de desempeño, Serie 1
(Experimento enfocado). .…………………………………………..……………....
70
5.4a: Soluciones finales al minimizar el MSE_T, Serie 1. .………………………...
75
5.4b: Soluciones finales al minimizar el MSE_V, Serie 1. .………………………...
75
5.5: Resultados del experimento, Serie 2. .………………………….……………...
78
5.6: Resultados del análisis de varianza en las medidas de desempeño, Serie 2. …..
79
5.7: Resultados del experimento enfocado, Serie 2. ………………………………..
81
5.8: Resultados del análisis de varianza en las medidas de desempeño, Serie 2
……………………………………………………....…..
82
5.9: Soluciones eficientes para el análisis de la Serie 2. ……………………....…...
85
(Experimento enfocado)
119
Lista De Tablas
120
6.1: Resultados del análisis de la Serie 1 par el pronóstico de un solo período. ……....…..
90
6.2: Modelo de RNA vs. Suavizado Exponencial Doble en el pronóstico de un solo
período, Serie 1. ……………………………………...………………………....…..
91
6.3: Resultados del análisis de la Serie 1 para el pronóstico de 12 períodos. .....…..
93
6.4: Resultados del análisis de la Serie 2, para el pronóstico de 12 períodos. ....…..
93
6.5: Modelo de RNA vs Método Tradicional vs Modelo Real en el análisis de la Serie 1.
...............................................................................................................................…..
94
6.6: Comparación de Resultados, Modelo de RNA vs Método Tradicional vs Modelo
Real, Serie 2. ....……………………………………………………………………..
96
APÉNDICES
A11 a A18: Pronóstico de la demanda mensual bajo diferentes combinaciones de
parámetros en el modelo de RNAs. ....……………………...………………...
122-137
A31: Resultados de la optimización del MAE. ....………………………………...
146
A32: Resultados de la optimización del MSE. .....………………………………...
146
A33: Resultados de la optimización de la B_Pred. ………………………..……...
146
A34: Resultados de la optimización de la S_Pred. …………………….....……….
147
B11: Pronóstico de los modelos de RNAs experimentales, Serie 1. ……....……...
148
B31: Pronóstico de los modelos de RNAs experimentales, Serie 2. ……....……...
154
B41: Pronóstico de los modelos de RNAs experimentales, experimento enfocado Serie
2. …………………………………………………………………………………...
155
APÉNDICE A1
Este apartado contiene las aproximaciones puntuales de la demanda obtenidas
mediante los diferentes modelos de RNAs resultantes de las combinaciones factoriales
del experimento.
Desde la Tabla A11 hasta la Tabla A18, la primer columna contiene el número de
período o mes; la segunda contiene el valor de la demanda registrada en el período
correspondiente; las siguientes columnas contienen el valor de la aproximación realizada
por el modelo de RNA, la cabecera de estas columnas contiene la combinación factorial
de los parámetros del modelo que dan como resultado tales aproximaciones.
Por ejemplo, en la Tabla A1, la columna 3 contiene [2,2,1,1,1], esta notación indica
que el parámetro neuronas =2; lags = 2; escala = 1; transformación = 1 y algoritmo= 1.
Es decir, el modelo de RNA correspondiente a estos valores de parámetros contiene 2
neuronas en la capa oculta, utiliza 2 datos históricos para realizar el pronóstico, maneja
los datos en escala observada y no aplica ninguna transformación; el algoritmo de
entrenamiento es el ‘lm’ (Levenberg- Marquart).
Entonces, las combinaciones de los parámetros son las cabeceras que se encuentran a
partir de la tercera columna de cada tabla y representan los valores de los parámetros en
el orden: [neuronas, lags, escala, transformación, algoritmo].
121
Apéndice A1
122
Tabla A11: Pronóstico de la demanda mensual del Mes 1 al 53.
Mes Demanda
112
1
99
2
117
3
127
4
132
5
140
6
161
7
167
8
172
9
181
10
181
11
185
12
186
13
208
14
224
15
229
16
249
17
257
18
253
19
283
20
282
21
298
22
305
23
383
24
388
25
390
26
434
27
421
28
441
29
466
30
478
31
500
32
493
33
509
34
499
35
495
36
496
37
491
38
520
39
526
40
530
41
535
42
547
43
553
44
560
45
583
46
602
47
622
48
613
49
638
50
643
51
646
52
646
53
[2,2,1,1,1]
[5,2,1,1,1]
108.74
124.12
135.79
141.74
149.85
170.43
178.59
183.96
192.90
194.00
197.69
199.10
219.41
236.66
243.14
261.82
271.41
268.77
295.13
297.79
311.87
319.93
388.64
401.80
404.08
441.56
435.55
450.89
473.92
486.58
505.93
502.60
514.90
508.48
504.13
504.51
500.53
523.61
531.58
535.45
539.90
550.06
556.13
562.34
581.29
598.60
616.13
611.21
629.61
636.00
638.81
117.70
131.56
141.50
146.55
153.65
171.81
178.65
183.33
191.24
192.03
195.34
196.53
214.82
229.98
235.51
252.43
260.77
258.18
282.49
298.00
305.00
333.60
388.00
408.69
410.75
446.59
439.86
454.92
476.83
488.64
507.37
503.62
515.88
509.22
505.15
505.61
501.67
524.54
531.83
535.54
539.89
549.92
555.74
561.84
580.79
597.87
615.37
609.91
628.99
635.06
637.86
[7,2,1,1,1] [2,3,1,1,1]
118.74
118.09
132.09
142.37
150.64
164.73
179.43
184.78
193.88
195.49
198.51
199.84
213.88
237.99
244.08
256.88
272.47
278.28
289.90
298.53
313.17
320.91
384.77
402.50
404.67
436.33
445.78
451.88
474.97
487.15
506.73
502.49
515.45
508.26
504.11
504.65
500.50
524.53
531.74
535.53
539.99
550.32
556.17
562.38
581.73
598.83
616.30
610.54
629.87
635.64
638.37
123.42
136.50
141.77
149.47
170.05
178.64
183.04
191.87
193.07
196.25
197.84
218.12
236.44
242.39
260.64
270.94
267.44
293.68
297.87
310.50
319.46
389.28
405.52
403.76
442.04
437.50
450.34
475.42
488.27
507.19
503.99
515.12
509.55
503.88
504.65
500.83
524.14
533.60
536.26
540.63
550.93
557.28
563.18
582.30
600.21
617.34
612.19
629.31
636.99
638.76
[5,3,1,1,1]
[7,3,1,1,1]
[2,6,1,1,1]
[5,6,1,1,1]
[7,6,1,1,1]
120.62
133.90
138.88
146.82
168.43
176.40
180.60
189.69
198.98
202.30
203.77
216.66
234.83
248.62
258.88
268.58
272.87
291.96
303.34
307.79
324.87
388.40
401.26
407.11
438.16
439.79
444.89
470.08
490.64
501.05
505.11
516.91
510.37
504.81
505.88
501.87
517.91
535.02
537.31
541.66
552.21
558.28
564.12
575.37
601.78
618.96
612.42
630.97
638.12
639.62
120.60
134.54
140.66
148.48
168.52
178.59
183.48
192.19
194.19
197.23
199.07
217.89
236.73
243.88
261.14
272.37
270.13
293.63
300.06
311.67
321.15
384.56
405.84
405.47
439.83
439.50
450.28
474.18
487.89
506.00
505.05
514.63
510.88
505.17
505.43
502.06
522.49
533.25
536.38
540.67
550.34
557.03
562.92
580.73
598.77
615.96
613.01
628.04
636.87
639.09
155.53
168.95
182.24
188.17
190.18
193.38
198.17
197.99
215.94
235.89
247.14
257.62
266.43
269.71
286.54
295.21
314.32
315.02
380.44
412.51
419.83
426.89
435.54
459.34
468.48
494.51
514.55
508.13
517.82
511.55
511.18
506.58
506.31
528.41
540.46
548.60
543.69
552.12
562.97
569.63
584.10
603.03
622.07
617.57
626.92
633.76
643.78
148.28
161.56
177.62
183.71
189.00
194.79
200.04
202.28
216.89
237.16
247.24
257.88
270.44
275.33
290.09
303.91
316.48
323.76
371.29
409.90
411.88
426.90
443.40
459.57
475.16
495.94
514.24
515.00
522.38
524.87
497.88
497.33
496.61
511.21
548.50
552.65
552.35
535.22
571.07
576.85
589.33
606.95
623.57
624.63
631.90
644.25
626.74
150.50
178.54
173.83
184.06
184.12
199.37
189.96
204.13
225.71
244.67
242.43
256.77
274.69
262.13
284.07
297.51
311.74
323.71
381.99
418.01
426.23
429.09
429.08
457.65
473.50
496.20
509.63
510.24
507.68
507.82
510.74
504.39
500.06
531.59
538.23
537.33
547.80
552.04
563.29
572.29
588.71
606.52
613.81
622.33
635.99
633.34
648.76
Apéndice A1
123
Continuación Tabla A11: Pronóstico de Demanda del Mes 54 al 71.
Mes
Demanda
54
709
639.11
638.11
638.59
638.93
639.63
639.51
639.44
651.40
644.08
55
678
686.74
687.85
680.81
685.88
681.82
682.70
673.51
677.63
685.21
56
689
669.77
668.71
678.47
671.32
671.74
673.94
675.38
688.54
673.66
57
58
680
627
674.95
669.28
674.78
668.60
674.60
668.37
672.44
668.66
673.89
669.52
673.20
670.28
677.13
656.10
682.97
651.12
679.07
655.26
59
646
628.00
625.92
636.19
626.81
624.76
631.48
634.26
632.19
621.71
60
645
637.18
636.51
637.23
634.56
635.54
634.41
632.10
627.10
635.44
61
664
638.35
637.32
637.80
638.94
639.75
639.37
633.48
631.56
618.12
62
671
652.74
652.27
652.72
652.30
654.03
651.68
661.69
646.64
665.48
63
671
659.97
659.40
659.57
660.16
661.67
660.31
663.10
674.92
670.37
64
545
660.67
659.99
660.06
660.20
661.26
661.04
661.49
646.95
666.57
65
545
562.89
559.89
553.30
561.79
556.18
555.71
581.68
534.65
562.99
66
545
549.52
549.17
549.41
543.54
542.92
545.81
537.74
544.94
535.20
67
424
549.52
549.17
549.41
549.99
550.63
550.43
459.39
492.07
493.06
68
454.6
450.46
451.85
441.35
448.75
444.79
443.89
419.45
452.45
451.63
69
457.8
462.57
466.17
463.86
456.47
458.81
457.07
465.48
469.68
460.61
70
465.2
468.62
471.38
468.99
470.36
472.68
470.82
452.57
409.67
416.62
471.5
475.11
477.62
475.58
475.49
477.63
475.95
506.54
489.21
482.24
Pronóstico
481.13
483.34
481.54
481.77
483.78
482.19
498.69
509.03
493.12
71
[2,2,1,1,1] [5,2,1,1,1] [7,2,1,1,1] [2,3,1,1,1] [5,3,1,1,1] [7,3,1,1,1] [2,6,1,1,1] [5,6,1,1,1] [7,6,1,1,1]
Apéndice A1
124
Tabla A12: Pronóstico de la demanda mensual del Mes 1 al 53.
Mes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
Demanda [2,2,1,1,2] [5,2,1,1,2] [7,2,1,1,2] [2,3,1,1,2] [5,3,1,1,2] [7,3,1,1,2] [2,6,1,1,2] [5,6,1,1,2] [7,6,1,1,2]
112
99
117
127
132
140
161
167
172
181
181
185
186
208
224
229
249
257
253
283
282
298
305
383
388
390
434
421
441
466
478
500
493
509
499
495
496
491
520
526
530
535
547
553
560
583
602
622
613
638
643
646
646
117.22
125.60
136.37
142.15
148.87
165.81
175.77
181.12
189.30
191.78
194.86
196.74
214.28
233.50
242.26
260.17
272.74
271.82
295.45
303.54
316.38
326.77
389.24
412.77
415.37
444.33
446.08
455.20
473.14
483.94
496.47
496.88
502.87
501.01
497.62
497.42
495.31
511.19
513.98
516.43
519.32
549.78
553.55
591.43
623.78
631.44
638.16
637.72
642.67
645.61
646.57
112.11
123.81
138.11
145.23
152.79
169.31
178.90
183.51
189.85
192.71
194.76
196.61
207.45
224.03
235.28
248.94
269.25
273.88
288.65
317.25
326.04
344.63
383.27
411.87
413.71
432.09
442.02
449.12
474.34
489.47
501.55
502.28
507.28
505.34
502.81
502.61
501.03
512.31
518.02
521.04
525.13
537.61
546.08
556.95
597.18
625.36
642.06
636.67
648.46
649.82
650.43
116.83
127.39
137.03
142.71
148.36
161.09
174.27
179.93
186.94
192.66
194.45
197.54
208.23
231.17
244.90
258.55
275.79
278.24
292.85
307.64
317.01
327.80
384.05
405.36
407.53
442.58
436.79
451.78
474.32
486.52
506.04
501.87
514.85
507.64
503.48
504.02
499.87
524.00
531.34
535.18
539.72
550.24
556.19
562.53
582.27
599.61
617.20
611.33
630.73
636.37
639.05
125.99
135.97
142.03
148.79
165.30
175.20
181.05
189.19
191.77
195.05
196.89
214.12
232.92
242.24
260.31
272.79
272.58
295.98
303.76
317.34
327.45
388.75
411.73
416.43
444.21
445.93
455.63
472.23
482.76
494.90
495.50
501.42
499.57
496.73
496.37
494.35
511.68
511.43
514.15
516.95
550.83
550.47
593.66
625.58
632.51
638.69
638.47
642.99
645.49
646.52
128.97
129.18
141.00
152.52
170.61
168.29
183.15
191.22
191.56
196.39
197.95
211.30
229.99
240.82
255.81
273.40
276.87
287.83
309.16
321.09
340.68
380.47
389.07
438.34
450.24
456.23
461.59
474.64
482.87
494.82
493.03
501.85
497.09
493.54
493.86
491.48
510.69
519.48
523.70
529.47
544.65
553.57
563.50
595.70
619.01
636.26
629.99
645.18
647.93
649.02
130.20
138.02
144.32
149.53
158.66
169.08
179.14
185.90
191.25
196.00
197.98
207.72
223.61
242.30
259.94
274.03
283.20
298.37
307.26
323.20
331.10
383.07
403.62
407.40
440.58
436.16
448.89
473.11
485.87
505.75
501.46
513.74
507.09
501.17
502.22
498.08
523.84
533.39
535.90
540.60
551.97
558.60
564.88
585.82
604.33
621.33
615.13
632.62
639.38
640.69
161.99
167.34
170.60
180.27
180.08
187.51
200.00
200.95
204.61
229.81
238.47
259.75
260.82
262.47
292.18
312.11
317.67
366.90
377.50
390.13
434.94
420.45
432.38
463.79
462.52
487.10
517.75
506.56
519.45
502.64
505.15
495.02
491.73
520.01
532.55
554.93
547.26
552.53
565.25
576.28
592.80
612.75
635.53
632.52
640.95
639.53
651.20
161.28
166.50
172.24
180.46
180.68
185.76
186.36
207.06
224.77
239.75
242.43
253.01
255.06
273.79
283.37
301.06
310.92
381.44
386.61
389.92
434.14
420.98
440.80
475.12
479.95
483.69
495.30
494.39
501.34
505.80
501.89
506.84
503.49
522.66
535.30
534.52
540.42
551.02
569.39
577.84
600.08
620.42
634.30
634.11
641.29
648.01
649.20
157.83
165.38
167.47
186.77
178.53
198.94
211.41
210.27
225.47
241.40
250.34
259.93
255.84
268.55
288.22
288.97
312.54
312.73
385.17
391.76
428.97
422.33
426.77
465.87
475.03
496.46
527.05
514.20
524.29
511.98
508.99
504.83
499.68
530.61
542.86
554.76
551.14
555.24
566.57
574.44
590.61
608.44
628.37
623.01
631.83
633.83
642.23
Apéndice A1
125
Continuación Tabla A12: Pronóstico de Demanda del Mes 54 al 71.
Mes
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
Demanda
709
678
689
680
627
646
645
664
671
671
545
545
545
424
454.6
457.8
465.2
471.5
Pronóstico
[2,2,1,1,2] [5,2,1,1,2] [7,2,1,1,2] [2,3,1,1,2] [5,3,1,1,2] [7,3,1,1,2] [2,6,1,1,2] [5,6,1,1,2] [7,6,1,1,2]
646.79
650.45
639.25
646.74
649.04
640.71
647.54
650.55
640.04
657.64
654.07
686.51
656.14
659.74
681.32
667.35
656.04
669.46
656.39
653.50
667.82
655.07
655.69
667.99
666.86
656.37
666.76
656.36
653.79
673.99
655.40
658.21
669.25
675.03
655.61
673.55
655.57
653.55
668.03
654.55
657.33
666.03
656.35
627.03
652.90
639.17
645.47
626.57
638.35
640.47
627.20
638.32
650.39
620.99
645.41
650.35
637.98
645.83
648.29
636.74
637.27
652.81
627.81
646.59
650.27
638.47
646.45
648.77
640.86
623.89
653.60
621.45
650.15
652.64
653.11
649.68
654.19
653.20
657.75
654.89
652.47
652.60
653.13
659.67
651.79
655.81
659.67
661.24
655.71
660.29
653.03
653.14
660.13
652.29
655.82
659.34
662.20
654.41
656.83
538.98
540.93
558.48
536.28
541.81
557.25
545.03
544.99
570.43
526.11
535.78
549.30
544.79
537.94
541.70
534.68
545.00
524.79
526.11
535.78
549.30
523.66
542.52
550.37
478.16
424.01
500.97
470.73
454.60
447.76
472.65
455.10
443.72
454.66
454.57
442.71
463.59
459.58
463.25
466.02
456.14
454.82
456.57
457.80
454.73
471.38
474.61
468.71
470.64
474.43
467.66
421.51
465.17
419.76
475.91
480.18
475.13
475.54
476.85
472.86
478.54
470.25
488.25
480.53
486.03
481.01
479.92
480.09
479.10
492.31
497.60
507.85
Apéndice A1
126
Tabla A13: Pronóstico de Demanda del Mes 1 al 50.
Mes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
Demanda [2,2,1,2,1] [5,2,1,2,1] [7,2,1,2,1] [2,3,1,2,1] [5,3,1,2,1] [7,3,1,2,1] [2,6,1,2,1] [5,6,1,2,1] [7,6,1,2,1]
112.00
99.00
117.00
127.00
132.00
140.00
161.00
167.00
172.00
181.00
181.00
185.00
186.00
208.00
224.00
229.00
249.00
257.00
253.00
283.00
282.00
298.00
305.00
383.00
388.00
390.00
434.00
421.00
441.00
466.00
478.00
500.00
493.00
509.00
499.00
495.00
496.00
491.00
520.00
526.00
530.00
535.00
547.00
553.00
560.00
583.00
602.00
622.00
121.74
131.74
136.74
144.74
165.74
171.74
176.74
185.74
185.74
189.74
190.74
212.74
228.74
233.74
253.74
261.74
257.74
287.74
286.74
302.74
309.74
387.74
392.74
394.74
438.74
425.74
445.74
470.74
482.74
504.74
497.74
513.74
503.74
499.74
500.74
495.74
524.74
530.74
534.74
539.74
551.74
557.74
564.74
587.74
606.74
116.15
139.65
144.65
152.65
173.65
179.65
184.65
193.65
183.56
186.28
198.71
207.15
236.65
241.65
257.00
269.65
282.98
282.15
284.56
297.15
317.65
382.15
390.56
402.65
433.15
423.56
440.15
478.65
490.65
512.65
495.56
508.15
501.60
496.00
491.00
501.68
519.15
528.56
542.65
547.65
559.65
565.65
572.65
595.65
614.65
130.84
139.77
144.77
152.68
167.28
179.77
184.77
193.50
193.58
186.01
217.17
203.45
236.77
241.77
256.94
269.77
284.10
278.45
294.77
293.45
317.77
378.45
400.77
422.03
429.45
433.77
454.84
478.77
490.77
512.77
505.77
524.86
491.85
495.90
491.01
509.19
515.45
538.77
542.71
549.23
552.30
565.77
572.77
602.00
614.77
136.72
141.72
149.72
170.72
176.72
181.72
190.72
190.72
194.72
195.72
189.91
233.72
238.72
258.72
266.72
262.72
264.95
291.72
310.28
314.72
382.68
397.72
419.81
415.92
430.72
470.81
475.72
487.72
509.72
502.72
497.61
508.72
504.74
477.91
500.72
501.92
535.72
539.72
544.72
556.72
562.72
569.72
592.72
611.72
129.42
146.78
149.98
168.72
173.65
181.98
190.98
187.68
194.97
194.60
214.99
226.29
245.16
258.98
263.66
269.16
271.51
290.60
307.92
313.58
387.66
394.65
406.16
424.15
431.24
431.52
468.42
492.98
509.98
499.65
499.52
507.60
486.81
478.99
499.60
512.20
534.60
540.07
544.98
555.02
556.49
569.98
590.96
602.46
136.06
140.03
154.66
170.06
171.79
160.13
195.68
183.92
186.00
195.06
223.53
233.06
243.65
256.97
266.06
283.00
282.01
291.06
286.13
314.06
388.85
397.06
466.88
412.03
430.06
466.00
474.98
492.66
493.05
507.66
497.13
508.06
506.56
497.45
521.40
522.93
535.06
518.13
549.66
558.85
561.69
574.63
601.39
611.06
167.00
175.65
180.65
189.65
189.65
193.65
194.65
216.65
232.65
249.00
257.65
265.65
261.65
291.65
290.65
306.65
313.65
391.65
396.65
422.30
442.65
429.65
449.65
474.65
486.65
508.65
501.65
517.65
507.65
503.65
504.65
520.00
526.00
498.61
562.30
543.65
555.65
561.65
568.65
591.65
610.65
167.00
176.49
176.81
190.49
188.55
194.49
195.49
215.55
233.49
233.81
258.49
271.83
267.83
292.49
296.83
295.53
314.49
390.55
397.49
434.00
443.49
428.56
450.49
475.49
500.00
509.49
507.85
516.55
508.49
496.00
505.49
495.68
526.00
535.49
535.00
544.49
553.00
562.49
574.83
592.49
616.83
166.04
187.22
180.18
195.82
195.82
192.52
205.56
222.81
244.22
237.18
263.82
271.82
265.91
282.00
297.77
306.18
324.56
388.00
408.22
398.18
406.91
439.42
448.52
480.83
486.10
507.52
513.22
511.79
518.56
497.79
491.00
509.64
526.00
508.84
538.18
547.00
556.08
572.56
568.18
597.82
622.22
49
613.00
626.74
634.65
634.77
631.72
631.98
636.66
630.65
636.83
630.18
50
638.00
617.74
615.56
625.77
622.72
629.16
627.66
621.65
617.81
633.22
Apéndice A1
127
Continuación Tabla A13: Pronóstico de Demanda del Mes 51 al 71.
Mes
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
Demanda
643.00
646.00
646.00
709.00
678.00
689.00
680.00
627.00
646.00
645.00
664.00
671.00
671.00
545.00
545.00
545.00
424.00
454.60
457.80
465.20
Pronóstico
[2,2,1,2,1] [5,2,1,2,1] [7,2,1,2,1] [2,3,1,2,1] [5,3,1,2,1] [7,3,1,2,1] [2,6,1,2,1] [5,6,1,2,1] [7,6,1,2,1]
642.74
637.15
646.56
638.78
628.52
626.10
646.65
645.55
643.00
647.74
645.56
655.77
652.72
651.60
652.06
651.65
652.49
662.56
650.74
658.65
638.13
655.72
658.07
634.13
654.65
643.53
654.18
650.74
709.01
677.15
655.72
662.17
709.00
654.65
655.49
665.56
713.74
708.15
704.45
691.97
697.62
687.02
678.00
678.03
676.55
682.74
680.56
690.77
687.72
688.61
687.06
686.65
687.49
702.95
693.74
696.27
689.90
691.01
679.52
685.80
721.30
683.65
698.36
684.74
627.00
627.00
661.91
688.60
672.78
628.96
689.49
638.88
646.00
637.68
645.22
636.72
642.98
638.56
659.30
621.65
645.64
650.74
653.27
646.90
648.01
638.48
644.93
654.65
655.49
652.71
649.74
647.56
657.77
626.91
653.60
637.78
617.61
644.34
609.60
668.74
663.15
659.45
673.74
671.60
652.13
671.00
670.99
682.64
675.74
683.65
683.77
680.72
679.60
680.06
643.61
670.47
635.27
675.74
673.56
558.30
680.72
687.16
659.13
643.61
665.65
581.12
545.00
555.68
563.22
554.72
551.66
556.56
553.65
545.00
557.91
545.00
552.27
545.90
547.01
537.45
525.52
545.00
539.65
539.45
549.74
424.00
424.02
526.91
527.98
457.69
493.96
424.00
514.33
454.60
434.68
442.22
433.72
434.62
435.56
456.30
418.65
447.37
459.34
461.87
455.50
456.61
446.98
435.12
427.21
451.19
449.27
462.54
460.36
470.57
439.71
466.40
450.58
430.41
457.14
422.40
469.94
477.85
458.78
474.93
475.18
453.33
437.81
459.85
483.84
Apéndice A1
128
Tabla A14: Pronóstico de Demanda del Mes 1 al 50.
Mes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Demanda [2,2,1,2,2] [5,2,1,2,2] [7,2,1,2,2] [2,3,1,2,2] [5,3,1,2,2] [7,3,1,2,2] [2,6,1,2,2] [5,6,1,2,2] [7,6,1,2,2]
112.00
99.00
117.00
127.00
117.32
118.05
118.19
132.00
127.36
128.36
128.62
127.17
127.40
130.74
140.00
132.29
133.21
133.42
132.35
132.94
136.38
161.00
140.30
141.19
141.39
140.27
140.73
144.23
167.00
161.38
162.37
162.63
161.22
161.57
164.93
161.02
160.96
160.91
172.00
167.34
168.35
168.60
167.35
167.95
171.38
167.29
167.66
167.94
181.00
172.27
173.09
173.26
172.34
172.93
176.37
172.27
172.60
172.85
181.00
181.31
182.22
182.43
181.23
181.59
184.94
181.17
181.35
181.49
185.00
181.23
181.91
182.04
181.28
181.77
185.30
181.25
181.55
181.78
186.00
185.23
185.69
185.76
185.21
185.53
188.57
185.26
185.59
185.84
208.00
186.21
186.68
186.75
186.16
186.36
188.87
186.15
186.32
186.44
224.00
208.38
209.35
209.61
208.09
208.11
208.28
208.14
208.27
208.37
229.00
224.39
225.37
225.64
224.32
224.89
228.37
224.26
224.59
224.84
249.00
229.32
230.31
230.54
229.36
229.97
233.38
229.27
229.61
229.86
257.00
249.38
250.36
250.62
249.29
249.80
253.31
249.19
249.41
249.57
253.00
257.35
258.35
258.61
257.34
257.92
261.38
257.25
257.56
257.79
283.00
253.17
253.46
253.49
253.35
253.95
257.38
253.29
253.67
253.94
282.00
283.39
284.37
284.63
283.04
282.91
280.92
283.18
283.38
283.52
298.00
282.32
283.35
283.60
282.35
282.95
286.38
282.27
282.63
282.89
305.00
298.34
299.28
299.51
298.34
298.91
302.37
298.29
298.65
298.92
383.00
305.33
306.33
306.58
305.28
305.78
309.33
305.21
305.45
305.64
388.00
383.41
384.37
384.64
383.16
383.39
385.80
383.15
383.29
383.40
390.00
388.40
389.37
389.64
388.37
388.98
392.38
388.30
388.68
388.96
434.00
390.23
390.84
390.95
390.37
390.98
394.38
390.30
390.68
390.96
421.00
434.40
435.37
435.64
434.05
433.94
432.53
434.12
434.22
434.27
441.00
421.27
422.33
422.58
421.37
421.98
425.38
421.30
421.68
421.96
466.00
441.33
442.15
442.32
441.33
441.91
445.35
441.30
441.68
441.96
478.00
466.40
467.37
467.64
466.15
466.34
469.52
466.11
466.21
466.29
500.00
478.38
479.37
479.64
478.37
478.98
482.38
478.29
478.67
478.94
493.00
500.39
501.37
501.64
500.36
500.96
504.38
500.30
500.68
500.96
509.00
493.22
494.07
494.25
493.36
493.97
497.38
493.21
493.45
493.64
499.00
509.32
510.16
510.34
509.23
509.61
512.63
509.27
509.61
509.86
495.00
499.14
499.44
499.48
499.27
499.73
503.31
499.28
499.64
499.91
496.00
495.07
494.34
494.11
495.18
495.41
497.20
495.23
495.52
495.72
491.00
496.17
496.03
495.97
495.92
495.48
492.28
496.15
496.29
496.40
520.00
491.12
490.79
490.68
491.08
491.03
490.80
491.01
490.95
490.91
526.00
520.39
521.36
521.63
519.94
519.57
516.40
520.13
520.26
520.35
530.00
526.36
527.37
527.63
526.34
526.93
530.38
526.16
526.35
526.51
535.00
530.26
531.04
531.19
530.36
530.96
534.38
530.24
530.53
530.74
547.00
535.26
536.01
536.15
535.22
535.58
538.91
535.09
535.14
535.17
553.00
547.33
548.29
548.52
547.19
547.48
550.52
547.12
547.21
547.29
560.00
553.31
554.27
554.50
553.30
553.81
557.34
553.29
553.66
553.94
583.00
560.30
561.18
561.37
560.30
560.81
564.32
560.22
560.50
560.70
602.00
583.39
584.37
584.63
583.21
583.55
586.82
583.16
583.34
583.48
622.00
602.39
603.37
603.64
602.35
602.94
606.38
602.27
602.61
602.86
613.00
622.39
623.37
623.64
622.37
622.97
626.38
622.29
622.66
622.93
638.00
613.18
613.83
613.95
613.37
613.98
617.38
613.28
613.64
613.91
Apéndice A1
129
Continuación Tabla A14: Pronóstico de Demanda del Mes 51 al 71.
Mes
Demanda
[2,2,1,2,2] [5,2,1,2,2] [7,2,1,2,2] [2,3,1,2,2] [5,3,1,2,2] [7,3,1,2,2] [2,6,1,2,2] [5,6,1,2,2] [7,6,1,2,2]
51
643.00
638.37
639.33
639.57
638.15
638.32
639.12
638.17
638.35
638.47
52
646.00
643.35
644.36
644.62
643.30
643.84
647.37
643.29
643.66
643.93
53
646.00
646.25
646.92
647.05
646.35
646.95
650.38
646.29
646.67
646.94
54
709.00
646.20
646.50
646.54
646.21
646.55
649.77
646.24
646.53
646.75
55
678.00
709.41
710.37
710.64
708.94
708.55
705.39
708.94
708.75
708.60
56
689.00
678.15
679.28
679.52
678.37
678.98
682.38
678.30
678.68
678.96
57
680.00
689.13
688.33
688.09
689.34
689.91
693.31
689.23
689.48
689.66
58
627.00
680.12
680.14
680.11
679.91
679.45
676.39
679.91
679.67
679.49
59
646.00
626.95
626.15
625.84
627.27
627.72
631.13
627.25
627.56
627.79
60
645.00
646.11
645.18
644.89
645.82
645.24
642.14
646.07
646.06
646.01
61
664.00
645.27
646.23
646.44
644.84
644.28
641.15
644.82
644.44
644.17
62
671.00
664.36
665.33
665.57
664.26
664.71
668.13
664.26
664.58
664.83
63
671.00
671.34
672.35
672.60
671.31
671.85
675.36
670.97
670.85
670.77
64
545.00
671.22
671.79
671.89
671.34
671.93
675.38
670.84
670.49
670.23
65
545.00
544.94
544.15
543.84
545.36
545.97
549.38
545.28
545.65
545.92
66
545.00
544.95
544.15
543.84
544.82
544.24
541.14
544.81
544.42
544.15
67
424.00
545.18
545.25
545.24
544.82
544.24
541.14
544.81
544.43
544.15
68
454.60
423.94
423.15
422.84
424.35
424.94
428.38
424.29
424.66
424.93
69
457.80
454.57
453.75
453.44
454.42
453.84
450.74
454.41
454.02
453.75
70
465.20
458.15
459.16
459.43
457.62
457.04
453.94
457.61
457.22
456.95
71
Pronóstico
465.49
466.31
466.48
465.56
466.16
469.58
465.48
465.85
466.13
Apéndice A1
130
Tabla A15: Pronóstico de Demanda del Mes 1 al 50.
Mes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Demanda [2,2,2,1,1] [5,2,2,1,1] [7,2,2,1,1] [2,3,2,1,1] [5,3,2,1,1] [7,3,2,1,1] [2,6,2,1,1] [5,6,2,1,1] [7,6,2,1,1]
112.00
99.00
117.00
113.21
119.09
112.88
127.00
123.00
123.00
123.39
122.12
126.70
128.42
132.00
134.36
134.55
135.18
133.36
138.00
138.70
140.00
140.39
141.03
141.36
139.61
143.82
141.21
161.00
147.58
147.36
148.67
146.91
149.70
146.48
150.45
161.48
155.94
167.00
165.55
162.64
166.70
164.94
164.03
165.45
162.82
174.00
168.12
172.00
175.42
175.27
176.39
174.94
175.18
173.15
176.12
172.21
171.91
181.00
180.88
180.94
181.70
180.67
180.03
176.76
183.09
180.52
176.24
181.00
189.27
188.67
189.88
189.15
187.15
186.82
189.24
175.48
183.85
185.00
191.58
192.67
192.06
191.48
190.61
187.36
190.36
180.12
186.12
186.00
194.79
195.15
195.15
194.82
192.82
191.09
196.33
196.42
196.82
208.00
196.61
197.55
196.91
196.64
195.00
192.85
197.85
198.15
204.12
224.00
214.70
211.73
214.00
214.73
208.70
221.00
214.33
225.42
210.12
229.00
233.58
231.18
231.48
233.55
227.70
230.82
234.76
220.48
231.97
249.00
241.94
240.85
239.27
242.15
237.21
241.33
244.03
236.06
242.91
257.00
259.82
254.79
254.61
260.18
251.94
265.27
259.33
249.73
256.12
253.00
271.76
266.82
265.24
272.06
265.73
247.36
267.33
254.88
252.12
283.00
270.55
267.36
264.82
271.15
266.21
278.30
269.30
285.39
278.52
282.00
294.27
282.73
280.18
294.82
284.12
280.09
290.39
279.79
281.61
298.00
301.33
296.15
296.06
301.70
296.06
298.12
296.52
307.36
293.82
305.00
314.12
299.36
303.03
314.79
306.39
302.85
312.15
302.79
304.55
383.00
323.91
367.09
380.12
324.42
380.52
379.85
321.15
377.06
381.45
388.00
386.06
385.48
382.76
385.85
385.48
385.48
374.85
385.55
386.09
390.00
407.55
420.55
410.18
406.94
398.64
388.52
406.79
385.79
388.33
434.00
410.03
422.03
412.30
410.36
431.21
431.18
410.03
432.70
431.64
421.00
439.85
445.09
433.15
439.52
428.09
418.24
435.03
420.03
416.39
441.00
440.52
441.48
437.55
440.15
437.52
438.33
430.21
436.00
438.70
466.00
450.42
451.52
445.42
450.30
463.00
459.67
454.33
459.18
462.70
478.00
469.03
468.18
466.85
468.21
464.91
473.91
472.70
474.82
475.70
500.00
480.15
477.70
480.91
479.18
479.76
484.33
484.82
496.45
494.12
493.00
493.67
494.55
498.85
492.48
494.55
498.18
510.64
499.09
489.18
509.00
493.67
490.27
498.91
492.58
498.06
495.45
505.94
505.91
506.61
499.00
500.52
502.55
508.39
499.36
503.45
502.33
514.18
496.52
500.03
495.00
498.12
495.30
505.00
496.97
503.61
499.00
512.67
491.79
489.00
496.00
494.52
491.73
500.06
493.67
498.30
494.27
507.79
489.39
491.55
491.00
494.39
492.30
499.85
493.45
497.64
494.88
509.88
490.76
488.12
520.00
492.03
488.58
496.64
491.12
495.58
492.12
504.61
524.55
515.70
526.00
508.33
511.85
515.76
509.03
510.45
509.48
525.97
521.88
522.97
530.00
512.55
518.67
527.00
510.85
527.91
523.00
536.52
525.00
524.30
535.00
515.21
522.67
532.91
513.67
535.24
520.45
541.52
536.24
530.00
547.00
518.15
527.64
543.42
516.58
541.76
524.24
544.06
531.06
545.82
553.00
547.09
539.97
549.42
548.88
549.85
535.61
548.27
548.94
549.30
560.00
550.70
546.94
555.12
548.27
555.76
545.06
559.00
557.88
564.70
583.00
588.42
555.00
582.42
590.42
579.39
550.76
565.42
572.88
576.27
602.00
614.64
583.39
604.45
615.48
605.58
580.45
580.42
602.33
594.09
622.00
623.73
611.12
620.88
624.21
617.73
617.09
596.97
611.88
619.94
613.00
631.94
609.03
607.79
632.18
628.12
641.03
614.97
613.18
609.58
638.00
631.15
630.36
635.33
631.48
629.30
633.00
613.79
635.00
633.24
Apéndice A1
131
Continuación Tabla A15 Pronóstico de Demanda del Mes 51 al 71.
Mes
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
Demanda
643.00
646.00
646.00
709.00
678.00
689.00
680.00
627.00
646.00
645.00
664.00
671.00
671.00
545.00
545.00
545.00
424.00
454.60
457.80
465.20
471.50
Pronóstico
[2,2,2,1,1] [5,2,2,1,1] [7,2,2,1,1] [2,3,2,1,1] [5,3,2,1,1] [7,3,2,1,1] [2,6,2,1,1] [5,6,2,1,1] [7,6,2,1,1]
637.61
618.73
640.45
637.76
634.88
646.91
623.45
618.88
638.70
641.15
641.82
649.91
641.09
641.09
641.88
631.94
619.67
641.67
642.39
641.82
653.58
642.36
642.67
660.85
637.09
643.61
640.27
642.64
690.64
658.03
642.64
643.15
660.45
639.82
678.21
704.45
657.33
688.91
681.64
656.61
658.82
673.64
670.15
679.79
673.58
655.03
665.94
688.64
654.39
661.21
684.55
671.33
679.06
684.55
655.27
636.70
676.21
654.88
658.70
678.36
672.27
673.67
675.73
654.09
614.88
622.64
653.61
658.52
622.94
664.48
616.94
622.91
635.94
657.48
654.52
635.30
643.76
640.64
629.06
617.94
642.09
641.03
635.03
640.03
641.27
639.39
637.73
637.67
655.42
640.88
642.36
688.67
658.18
642.30
643.00
659.42
635.15
648.12
659.67
647.12
673.97
657.15
646.91
647.73
666.18
652.97
677.94
666.64
650.24
666.67
666.73
649.85
652.67
666.67
664.15
674.15
666.67
650.76
591.76
541.58
650.42
653.67
541.48
657.18
619.33
542.06
539.79
544.00
541.45
538.18
541.39
540.27
541.48
541.42
541.48
525.09
538.36
481.48
541.36
541.55
541.42
541.48
538.67
541.45
525.09
538.36
481.48
523.48
421.36
532.67
421.27
422.42
421.27
463.94
449.48
451.67
464.45
451.67
453.48
451.67
451.52
451.67
459.24
459.85
455.06
460.00
460.36
455.03
454.85
454.18
454.79
466.82
463.79
464.55
466.09
465.30
469.73
462.18
461.91
462.18
471.61
468.67
470.27
471.06
469.97
475.79
486.45
468.03
469.12
476.45
473.2158
476.27
475.7539
513.59
479.5061
504.98
351.7888
695.82
Apéndice A1
132
Tabla A16: Pronóstico de Demanda del Mes 1 al 50.
Mes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Demanda [2,2,2,1,2] [5,2,2,1,2] [7,2,2,1,2] [2,3,2,1,2] [5,3,2,1,2] [7,3,2,1,2] [2,6,2,1,2] [5,6,2,1,2] [7,6,2,1,2]
112.00
99.00
117.00
119.79
117.30
116.58
127.00
132.24
130.15
129.27
132.45
129.58
128.79
132.00
141.70
140.27
139.67
143.24
141.03
140.30
140.00
146.58
145.52
145.03
147.70
145.91
145.36
161.00
153.39
152.61
152.18
154.09
152.73
152.27
160.52
157.39
156.94
167.00
171.03
170.82
170.45
171.39
170.82
170.48
172.06
170.03
169.73
172.00
178.03
178.33
178.24
179.12
179.00
178.82
182.18
180.94
180.73
181.00
182.73
183.21
183.21
183.03
183.21
183.21
189.55
188.88
188.73
181.00
190.70
191.33
191.36
190.76
191.21
191.27
192.12
191.55
191.42
185.00
191.61
192.45
192.58
192.00
192.58
192.70
192.64
191.85
191.79
186.00
194.94
195.79
195.94
194.76
195.48
195.67
197.42
196.79
196.76
208.00
196.18
197.12
197.30
196.24
197.00
197.21
196.76
195.94
195.91
224.00
214.82
215.85
215.91
214.27
215.33
215.48
213.42
213.58
213.61
229.00
230.85
232.18
232.45
231.36
232.67
232.85
230.88
231.97
232.06
249.00
236.88
238.45
238.91
237.15
238.76
239.15
242.94
244.64
244.79
257.00
254.82
256.30
256.64
254.24
255.94
256.33
256.73
258.82
259.03
253.00
264.03
265.73
266.24
264.39
266.18
266.61
262.36
264.61
264.85
283.00
261.39
263.27
263.94
261.18
263.27
263.94
265.06
267.21
267.48
282.00
287.52
288.79
289.09
286.21
287.94
288.36
284.52
286.73
287.03
298.00
289.94
291.70
292.39
290.91
292.73
293.24
287.00
289.30
289.61
305.00
304.12
305.52
306.00
303.15
304.97
305.55
309.48
311.67
311.94
383.00
312.18
313.64
314.24
312.30
314.00
314.52
310.70
313.06
313.39
388.00
383.36
382.55
382.27
382.73
382.21
381.88
379.12
379.82
379.82
390.00
396.58
396.73
397.15
400.85
400.33
400.21
405.55
406.03
406.00
434.00
398.91
399.09
399.55
398.70
399.15
399.55
423.15
423.30
423.24
421.00
438.42
437.21
437.09
438.06
437.03
436.88
435.91
435.97
435.97
441.00
431.73
431.58
431.94
434.15
433.67
433.79
428.58
429.00
429.15
466.00
448.00
447.03
447.06
446.85
446.24
446.30
459.61
458.67
458.61
478.00
472.03
470.64
470.52
473.06
471.52
471.27
468.00
467.18
467.15
500.00
485.06
483.73
483.64
486.48
484.91
484.67
489.70
488.12
487.97
493.00
505.06
503.42
503.15
505.76
503.94
503.64
515.79
513.70
513.42
509.00
501.45
500.27
500.18
502.73
501.33
501.12
506.88
505.36
505.24
499.00
514.18
512.58
512.33
513.76
512.18
511.94
518.18
516.30
516.15
495.00
507.45
506.30
506.18
508.39
507.06
506.85
506.39
505.15
505.12
496.00
503.06
501.82
501.70
502.36
501.27
501.15
505.30
503.91
503.88
491.00
503.48
502.15
502.03
503.15
501.91
501.76
500.03
498.97
498.94
520.00
499.33
498.15
498.06
499.33
498.15
498.03
496.30
495.21
495.21
526.00
523.15
521.30
520.97
522.88
521.03
520.67
522.85
520.94
520.79
530.00
531.06
529.58
529.30
532.85
530.97
530.61
533.39
531.48
531.27
535.00
534.94
533.52
533.21
535.33
533.76
533.42
545.82
543.64
543.39
547.00
539.42
538.00
537.70
539.70
538.12
537.79
543.00
541.15
541.00
553.00
549.64
548.12
547.79
550.00
548.33
547.97
549.00
547.03
546.88
560.00
555.61
554.27
553.91
556.36
554.79
554.42
558.55
556.64
556.42
583.00
561.76
560.45
560.09
562.15
560.67
560.30
566.52
564.58
564.36
602.00
580.36
579.09
578.73
580.88
579.39
579.03
582.73
580.85
580.61
622.00
596.91
596.12
595.82
598.30
597.15
596.88
600.88
599.27
599.03
613.00
613.36
613.09
612.88
614.45
613.91
613.76
622.06
621.06
620.82
638.00
608.61
608.58
608.33
609.61
609.30
609.09
617.21
616.36
616.18
Apéndice A1
133
Continuación Tabla A16 pronóstico de Demanda del Mes 51 al 71
Mes
Demanda
[2,2,2,1,2] [5,2,2,1,2] [7,2,2,1,2] [2,3,2,1,2] [5,3,2,1,2] [7,3,2,1,2] [2,6,2,1,2] [5,6,2,1,2] [7,6,2,1,2]
51
643.00
625.82
625.97
625.88
625.30
625.42
625.36
628.76
628.27
628.15
52
646.00
631.52
632.21
632.12
632.70
633.15
633.18
630.09
630.09
630.03
53
646.00
634.03
634.88
634.82
634.09
634.85
634.88
640.03
640.39
640.39
54
709.00
634.27
635.18
635.15
634.21
635.06
635.06
636.73
637.27
637.33
55
678.00
675.97
678.76
679.70
675.79
678.82
679.85
672.39
675.03
675.27
56
689.00
661.12
664.00
664.24
663.64
666.30
666.88
666.88
669.61
669.88
57
680.00
665.76
668.42
668.91
663.70
666.67
667.09
678.00
681.30
681.67
58
627.00
660.82
663.36
663.70
660.82
663.42
663.88
652.52
654.73
655.00
59
646.00
623.88
625.06
624.79
622.79
624.00
623.76
620.24
621.00
621.09
60
645.00
632.64
633.21
633.18
629.61
630.52
630.39
623.79
624.94
625.09
61
664.00
633.58
634.48
634.42
634.39
635.09
635.12
616.30
617.33
617.42
62
671.00
646.55
647.85
648.00
646.27
647.61
647.82
650.27
651.82
652.06
63
671.00
652.82
654.67
654.88
653.48
655.27
655.61
657.52
659.64
659.91
64
545.00
653.39
655.36
655.58
653.36
655.33
655.67
657.24
658.97
659.15
65
545.00
561.45
562.15
561.94
560.79
561.58
561.27
566.03
566.55
566.52
66
545.00
549.00
547.70
547.39
541.33
541.33
541.15
528.61
528.97
528.94
67
424.00
549.00
547.70
547.39
549.03
547.64
547.30
500.36
501.94
501.88
68
454.60
446.58
447.91
448.94
446.48
448.12
449.06
448.21
449.36
449.45
69
457.80
460.27
458.94
458.85
452.39
452.79
453.24
454.85
454.97
455.03
70
465.20
466.36
465.39
465.45
468.06
466.85
466.73
425.15
426.03
426.27
71
471.50
473.15
472.03
472.00
473.15
472.09
472.06
482.67
480.94
480.79
Pronóstico
479.3897
478.20
478.1676
479.69
478.5033
478.40
493.3815
491.96
491.8227
Apéndice A1
134
Tabla A17: Pronóstico de demanda del Mes 1 al 50.
Mes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Demanda [2,2,2,2,1] [5,2,2,2,1] [7,2,2,2,1] [2,3,2,2,1] [5,3,2,2,1] [7,3,2,2,1] [2,6,2,2,1] [5,6,2,2,1] [7,6,2,2,1]
112.00
99.00
117.00
127.00
123.30
124.74
127.82
132.00
133.38
135.00
139.31
127.10
129.82
131.42
140.00
138.38
140.01
137.91
141.45
139.12
139.54
161.00
146.40
147.93
151.78
149.28
152.98
147.53
167.00
167.37
168.81
167.28
169.38
166.95
168.54
173.60
168.82
167.18
172.00
173.37
175.10
179.31
176.26
178.78
174.65
179.53
174.35
174.44
181.00
178.38
179.98
184.38
181.46
185.07
178.80
184.62
181.49
179.80
181.00
187.40
188.91
190.81
190.05
191.53
188.54
193.58
184.79
182.89
185.00
187.36
189.09
183.92
190.21
194.49
187.44
193.59
188.67
183.67
186.00
191.39
193.01
186.59
194.29
199.53
191.70
197.56
195.77
186.96
208.00
192.37
194.04
199.93
194.79
196.79
196.11
198.60
209.34
207.52
224.00
214.28
215.77
209.09
216.01
213.60
224.05
220.62
215.54
225.56
229.00
230.40
231.94
236.31
232.10
229.38
231.54
236.60
231.53
229.94
249.00
235.37
237.07
241.31
238.47
237.21
239.47
241.63
236.85
251.19
257.00
255.38
256.80
250.79
258.32
260.10
256.54
261.62
258.18
258.97
253.00
263.37
265.05
269.31
266.05
266.60
264.55
269.59
251.83
257.68
283.00
259.35
281.92
278.39
262.47
266.79
282.95
265.57
261.96
284.46
282.00
287.36
282.00
284.04
291.14
288.00
289.58
295.56
286.30
281.11
298.00
288.34
290.42
294.31
290.52
290.30
287.78
294.49
294.84
296.19
305.00
304.41
305.81
299.05
307.48
306.95
305.54
310.62
302.55
304.00
383.00
311.37
313.03
317.31
313.38
312.57
383.05
317.23
380.58
380.98
388.00
388.00
371.36
384.10
384.70
381.74
390.54
382.51
391.20
387.88
390.00
394.34
397.42
400.31
397.33
396.51
398.96
391.71
393.20
390.19
434.00
396.37
398.01
418.73
399.49
433.06
432.67
400.13
434.10
434.16
421.00
420.44
422.40
435.10
438.24
435.17
420.08
423.48
421.00
421.05
441.00
427.33
430.42
433.31
430.35
436.36
441.00
432.64
441.00
440.93
466.00
447.15
448.73
465.46
450.49
458.60
448.54
450.10
463.69
465.98
478.00
472.34
473.83
478.31
450.89
466.31
470.42
476.16
478.00
479.01
500.00
484.38
486.03
490.31
487.45
500.00
485.57
490.59
497.98
500.40
493.00
506.37
507.82
494.87
509.45
501.86
507.54
511.55
506.49
492.92
509.00
499.34
501.48
505.31
502.44
513.22
509.05
505.62
509.07
508.77
499.00
515.40
516.79
508.73
518.44
499.00
516.54
521.59
498.79
499.07
495.00
505.34
508.18
514.24
507.52
509.98
494.95
502.38
495.00
493.84
496.00
501.37
511.87
495.44
504.45
518.83
495.94
507.62
509.45
495.84
491.00
502.38
491.04
491.13
501.70
502.86
520.64
507.64
490.37
490.67
520.00
497.36
507.99
520.43
499.56
502.36
519.96
503.62
517.42
519.76
526.00
524.67
525.99
521.01
525.51
523.20
524.42
532.62
524.98
526.18
530.00
532.36
534.19
538.31
533.68
531.79
534.08
538.63
541.34
529.90
535.00
536.38
537.99
532.00
539.48
544.42
535.83
542.54
537.63
534.92
547.00
541.38
542.96
541.39
544.14
547.19
542.36
547.59
546.08
546.70
553.00
553.41
554.88
552.64
555.74
555.52
563.00
559.62
552.36
552.49
560.00
559.38
561.01
565.04
562.08
563.81
560.52
565.20
560.47
561.96
583.00
566.39
567.95
581.99
569.35
574.46
567.51
572.62
571.26
583.35
602.00
589.30
590.79
590.22
591.40
588.78
590.54
595.62
591.85
596.96
622.00
608.40
609.91
614.31
610.86
608.61
609.54
614.62
608.74
620.78
613.00
628.40
629.87
634.31
631.44
624.01
629.54
634.62
626.86
611.51
638.00
619.34
621.52
625.31
622.48
626.82
637.98
625.58
637.31
636.16
Apéndice A1
135
Continuación Tabla A17pronóstico de Demanda del Mes 51 al 71.
Mes
51
Demanda
643.00
[2,2,2,2,1] [5,2,2,2,1] [7,2,2,2,1] [2,3,2,2,1] [5,3,2,2,1] [7,3,2,2,1] [2,6,2,2,1] [5,6,2,2,1] [7,6,2,2,1]
643.56
645.72
639.44
647.35
649.90
645.54
650.62
642.89
642.97
52
646.00
649.36
651.17
655.31
649.14
647.88
648.65
648.51
646.00
645.33
53
646.00
652.38
654.00
671.89
655.48
658.22
635.21
658.62
651.47
644.61
54
709.00
652.37
709.21
710.36
655.19
659.88
696.68
658.07
712.08
710.68
55
678.00
678.08
697.36
710.18
693.00
707.73
678.02
719.95
677.71
677.94
56
689.00
684.33
690.60
690.31
687.44
699.85
686.93
685.66
688.21
688.52
57
680.00
695.40
686.34
686.85
698.49
680.00
682.44
690.91
680.06
679.89
58
627.00
686.34
627.00
627.00
636.23
682.35
626.90
624.64
627.01
627.08
59
646.00
633.33
646.35
645.96
636.49
645.83
648.19
639.61
646.00
646.01
60
645.00
647.96
643.28
643.67
640.31
650.24
650.42
646.20
645.03
644.90
61
664.00
651.35
653.24
657.31
663.99
643.12
649.71
657.62
664.06
664.07
62
671.00
670.37
671.79
665.06
673.39
677.35
671.54
671.26
667.44
671.01
63
671.00
677.37
679.06
683.31
679.40
678.43
679.29
683.63
671.14
670.93
64
545.00
677.36
679.07
545.65
680.46
545.07
549.70
545.06
545.02
545.05
65
545.00
551.33
545.00
545.06
554.49
545.00
545.00
546.89
545.00
545.00
66
545.00
544.15
542.24
545.00
552.71
545.00
544.89
543.40
545.00
545.01
67
424.00
551.37
424.00
424.00
424.26
424.00
424.03
424.48
423.99
424.00
68
454.60
430.33
454.46
454.58
454.59
454.80
454.48
436.46
454.50
454.64
69
457.80
457.78
451.83
452.27
451.46
457.80
459.02
456.53
457.76
457.79
70
465.20
464.15
466.10
470.11
464.79
454.16
462.22
465.14
465.14
465.23
71
Pronóstico
471.59
473.12
467.16
474.68
479.05
474.01
548.59
468.32
648.85
Apéndice A1
136
Tabla A18: Pronóstico de demanda del Mes 1 al 50.
Mes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Demanda [2,2,2,2,2] [5,2,2,2,2] [7,2,2,2,2] [2,3,2,2,2] [5,3,2,2,2] [7,3,2,2,2] [2,6,2,2,2] [5,6,2,2,2] [7,6,2,2,2]
112.00
99.00
117.00
127.00
121.77
121.77
121.77
132.00
131.77
131.77
131.77
127.67
127.58
127.56
140.00
136.77
136.77
136.77
141.30
141.28
141.28
161.00
144.77
144.77
144.77
146.40
146.33
146.31
167.00
165.77
165.77
165.77
165.09
165.01
165.00
164.44
163.54
163.44
172.00
171.77
171.77
171.77
174.28
174.22
174.21
182.63
173.90
173.72
181.00
176.77
176.77
176.77
181.82
181.81
181.81
187.48
180.47
180.29
181.00
185.77
185.77
185.77
186.17
186.08
186.07
193.36
184.66
184.53
185.00
185.77
185.77
185.77
186.98
186.90
186.89
194.87
185.73
185.58
186.00
189.77
189.77
189.77
191.05
190.97
190.96
200.36
190.79
190.62
208.00
190.77
190.77
190.77
190.06
189.96
189.95
199.86
189.44
189.31
224.00
212.77
212.77
212.77
211.15
211.06
211.05
218.41
211.22
211.10
229.00
228.77
228.77
228.77
228.51
228.44
228.43
238.61
228.86
228.71
249.00
233.77
233.77
233.77
239.88
239.90
239.91
240.88
238.55
238.37
257.00
253.77
253.77
253.77
256.07
256.02
256.01
260.64
254.53
254.39
253.00
261.77
261.77
261.77
263.18
263.11
263.10
269.06
261.33
261.19
283.00
257.77
257.77
257.77
263.45
263.45
263.45
270.91
262.12
261.93
282.00
287.77
287.77
287.77
286.20
286.12
286.10
293.47
285.77
285.64
298.00
286.77
286.77
286.77
287.19
287.11
287.10
294.81
286.22
286.08
305.00
302.77
302.77
302.77
308.85
308.87
308.87
311.95
308.27
308.06
383.00
309.77
309.77
309.77
309.23
309.14
309.13
315.16
308.10
307.98
388.00
387.77
387.77
387.77
385.24
385.20
385.19
366.98
385.26
385.15
390.00
392.77
392.77
392.77
399.57
399.65
399.66
395.23
399.61
399.40
434.00
394.77
394.77
394.77
414.84
415.83
416.01
372.74
410.76
410.55
421.00
438.77
438.77
438.77
435.61
435.54
435.53
427.09
432.49
432.43
441.00
425.77
425.77
425.77
430.02
430.00
430.00
430.99
426.58
426.43
466.00
445.77
445.77
445.77
454.42
454.53
454.55
455.63
455.22
454.96
478.00
470.77
470.77
470.77
465.52
465.45
465.44
465.84
464.48
464.42
500.00
482.77
482.77
482.77
488.45
488.47
488.47
484.98
486.81
486.62
493.00
504.77
504.77
504.77
509.98
509.99
509.99
514.29
510.19
509.98
509.00
497.77
497.77
497.77
502.57
502.56
502.55
504.91
499.04
498.90
499.00
513.77
513.77
513.77
517.14
517.10
517.09
521.66
515.45
515.28
495.00
503.77
503.77
503.77
502.98
502.88
502.86
497.08
502.17
502.03
496.00
499.77
499.77
499.77
502.91
502.85
502.84
509.24
501.79
501.61
491.00
500.77
500.77
500.77
496.52
496.42
496.40
500.59
497.10
496.99
520.00
495.77
495.77
495.77
494.19
494.08
494.06
502.39
493.74
493.63
526.00
524.77
524.77
524.77
521.18
521.10
521.08
533.22
522.96
522.83
530.00
530.77
530.77
530.77
530.22
530.14
530.13
539.86
530.20
530.07
535.00
534.77
534.77
534.77
542.10
542.16
542.17
534.61
540.69
540.51
547.00
539.77
539.77
539.77
540.44
540.35
540.34
548.12
538.69
538.57
553.00
551.77
551.77
551.77
551.35
551.26
551.23
554.62
549.69
549.58
560.00
557.77
557.77
557.77
558.70
558.63
558.61
565.55
559.08
558.91
583.00
564.77
564.77
564.77
567.12
567.06
567.05
574.39
566.32
566.15
602.00
587.77
587.77
587.77
587.13
587.05
587.03
594.06
586.58
586.46
622.00
606.77
606.77
606.77
608.05
607.99
607.98
614.93
607.47
607.33
613.00
626.77
626.77
626.77
632.14
632.15
632.15
636.34
631.23
631.04
638.00
617.77
617.77
617.77
624.52
624.56
624.56
630.48
621.91
621.72
Apéndice A1
137
Continuación Tabla A18 Pronóstico de demanda del Mes 51 al 71
Mes
51
Demanda
643.00
[2,2,2,2,2] [5,2,2,2,2] [7,2,2,2,2] [2,3,2,2,2] [5,3,2,2,2] [7,3,2,2,2] [2,6,2,2,2] [5,6,2,2,2] [7,6,2,2,2]
642.77
642.77
642.77
644.66
644.59
644.58
645.17
642.50
642.36
52
646.00
647.77
647.77
647.77
645.84
645.74
645.73
641.91
645.36
645.23
53
646.00
650.77
650.77
650.77
657.01
657.03
657.04
662.28
656.13
655.93
54
709.00
650.77
650.77
650.77
651.50
651.41
651.39
657.14
650.76
650.60
55
678.00
713.77
713.77
713.77
708.20
708.15
708.14
700.32
708.15
708.09
56
689.00
682.77
682.77
682.77
689.46
689.50
689.51
686.10
689.12
688.91
57
680.00
693.77
693.77
693.77
706.84
707.16
707.23
674.26
704.09
703.88
58
627.00
684.77
684.77
684.77
676.49
676.42
676.41
653.81
674.41
674.41
59
646.00
631.77
631.77
631.77
637.70
637.66
637.66
642.29
634.86
634.68
60
645.00
650.77
650.77
650.77
641.16
641.09
641.08
630.99
644.97
644.85
61
664.00
649.77
649.77
649.77
634.94
634.98
634.98
650.64
636.68
636.72
62
671.00
668.77
668.77
668.77
671.52
671.47
671.46
667.04
674.48
674.28
63
671.00
675.77
675.77
675.77
675.48
675.39
675.38
688.76
676.10
675.97
64
545.00
675.77
675.77
675.77
680.76
680.74
680.73
637.78
676.98
676.87
65
545.00
549.77
549.77
549.77
561.26
561.41
561.44
548.96
557.13
556.91
66
545.00
549.77
549.77
549.77
538.42
538.32
538.30
540.46
537.07
537.08
67
424.00
549.77
549.77
549.77
512.05
512.28
512.29
441.70
519.60
519.78
68
454.60
428.77
428.77
428.77
437.98
438.02
438.03
456.09
441.48
441.22
69
457.80
459.37
459.37
459.37
445.71
445.67
445.66
455.74
451.09
451.05
70
465.20
462.57
462.57
462.57
428.41
428.70
428.72
438.08
430.71
431.00
71
Pronóstico
469.97
469.97
469.97
477.25
477.30
477.32
429.46
482.20
481.97
En el Capítulo 4 se encuentra a detalle el análisis de los resultados mostrados en este
apéndice.
APÉNDICE A2
En esta sección, se muestra el análisis de residuos de manera gráfica para cada una de
las medidas de desempeño utilizadas en la construcción del modelo de RNA. Este
análisis es utilizado para la comprobación de los supuestos de los modelos de regresión.
En las Figuras A21, A22 y A23, las gráficas de la izquierda nos permitieron
comprobar el supuesto de una distribución normal en los residuos. Las de la derecha nos
llevaron a concluir que los residuos cumplen con el supuesto de independencia
estadística, pues no siguieron un patrón reconocido.
La Figura A21, corresponde al análisis de residuos del modelo de regresión de la
medida de desempeño S_Pred. La Figura A22 contiene el análisis de residuos
correspondiente al modelo de regresión para el MAE y la Figura A23 representa el
análisis de residuos para el del MSE.
138
Apéndice A2
139
S_Pred
Probabilidad Normal de los Residuos
Residuos vs. Valores Ajustados
99.9
50
25
90
Residuo
Percentil
99
50
10
0
-25
-50
1
0.1
-50
-25
0
Residuo
25
50
0
Histograma de los Residuos
160
Residuos vs. Orden de los Datos
25
12
Residuo
Frecuencia
80
120
Valor A justado
50
16
8
4
0
40
0
-25
-50
-60
-40
-20
0
Residuo
20
40
0
15
30
45
Orden de Observación
60
Figura A21: Gráficas para comprobación de normalidad e independencia estadística de
los residuos en el modelo de regresión de S_Pred.
MAE
Probabilidad Normal en los Residuos
Residuos vs. Valores Ajustados
3.0
99.9
1.5
90
Residuo
Percentil
99
50
10
1
0.1
0.0
-1.5
-3.0
-4
-2
0
Residuo
2
5
4
16
12
1.5
8
4
0
.
20
Residuos vs. Orden de los Datos
3.0
Residuo
Frecuencia
Histograma de los Residuos
10
15
Valor Ajustado
0.0
-1.5
-3.0
-2.4
-1.2
0.0
Residuo
1.2
2.4
0
15
30
45
60
Orden de Observación
Figura A22: Gráficas para comprobación de normalidad e independencia estadística de
los residuos en el modelo de regresión del MAE.
Apéndice A2
140
MSE
Probabilidad Normal de los Residuos
Residuos vs. Valores Ajustados
99.9
200
90
Residuo
Percentil
99
50
10
-200
1
0.1
-300
0
-150
0
Residuo
150
300
0
Histograma de los Residuos
200
15
Residuo
Frecuencia
800
Residuos vs. Orden de los Datos
20
10
5
0
200
400
600
Valor A justado
0
-200
-200
-100
0
Residuo
100
200
0
15
30
45
60
Orden de Observación
Figura A23: Gráficas para comprobación de normalidad e independencia estadística de
los residuos en el modelo de regresión del MSE.
Observamos que los supuestos de normalidad e independencia estaban satisfechos,
sin embargo aún nos faltaba comprobar el supuesto de varianza constante, para ello
graficamos los residuos de cada uno de los metamodelos contra cada una de las variables
o factores de nuestro experimento. En nuestro caso las variables fueron: neuronas, lags,
escala, transformación y algoritmo.
En las Figuras A24, A25 y A26 se muestran las gráficas de residuos contra variables
para nuestras medidas de desempeño de S_Pred, MAE y MSE, respectivamente. A partir
del comportamiento de los residuos en estas gráficas, concluimos que nuestros modelos
de regresión cumplen con el supuesto de varianza constante en los residuos.
Apéndice A2
141
Residuos vs. Neuronas
Residuos vs. Lags
50
Residuo
Residuo
50
0
0
-50
-50
2
5
2
7
3
6
Lags
Neuronas
Residuos vs. Escala
Residuos vs. Transformación
50
Residuo
Residuo
50
0
0
-50
-50
1
1
2
2
Transformación
Escala
Residuos vs. Algoritmo
Residuo
50
0
-50
1
2
Algoritmo
Figura A24: Gráficas de Residuos vs. Variables para la comprobación de igualdad de
varianza en los residuos del modelo de regresión de la S_Pred.
Apéndice A2
142
Residuos vs. Neuronas
Residuos vs. Lags
2
Residuo
Residuo
2
0
0
-2
-2
2
4
2
6
3
4
Lags
Neuronas
Residuos vs. Escala
6
Residuos vs. Transformación
2
Residuo
2
Residuo
5
0
0
-2
-2
1
2
1
2
Transformación
Escala
Residuos vs. Algoritmo
Residuo
2
0
-2
1
2
Algoritmo
Figura A25: Gráficas de Residuos vs. Variables para la comprobación de igualdad de
varianza en los residuos del modelo de regresión del MAE.
Apéndice A2
143
Residuos vs. Neuronas
Residuals Versus Lags
200
Residuo
Residuo
200
0
-200
0
-200
2
5
7
2
3
6
Neuronas
Lags
Residuos vs. Escala
Residuos vs. Transformación
200
Residuo
Residuo
200
0
-200
0
-200
1
2
1
Escala
2
Transformación
Residuos vs. s Algoritmo
Residuo
200
0
-200
1
2
Algoritmo
Figura A26: Gráficas de Residuos vs. Variables para la comprobación de igualdad de
varianza en los residuos del modelo de regresión del MSE.
Apéndice A2
144
Una vez realizado el análisis de los residuos y habiendo comprobado los supuestos
bajo los cuales se desarrollaron los modelos, concluimos que los metamodelos eran
apropiados para describir el comportamiento de nuestras medidas de desempeño, así que
procedimos con la fase de optimización tomando como base los modelos encontrados
(metamodelos).
Como puede observarse, en este caso es fácil comprobar los supuestos, sin embargo
no siempre sucede de esta manera, así que es necesario recurrir a técnicas estadísticas
para llevar a cabo tal comprobación.
APÉNDICE A3
En este apartado, podemos observar los resultados obtenidos al optimizar los modelos
de optimización resultantes en cada una de las medidas de desempeño.
Las soluciones indican el valor que toma cada uno de los parámetros en el modelo de
RNA. Recordemos que estamos utilizando los parámetros: neuronas, lags, escala,
transformación y algoritmo. De esta manera, el primer elemento de la solución indica la
cantidad de neuronas en la capa oculta, el segundo corresponde al número de lags, el
tercero al tipo de escala, el cuarto a la transformación y por último el algoritmo de
entrenamiento. Para una explicación más amplia de la codificación de las soluciones, se
puede recurrir al Capítulo 4.
Al tratarse de problemas de optimización no convexos, se utilizaron múltiples
soluciones iniciales para optimizar cada uno de los modelo. La primera columna de las
siguientes tablas, contiene las soluciones que fueron utilizadas como punto de inicio para
la realización de la optimización, en la segunda columna se muestra la solución final que
encontró el optimizador a partir de la solución inicial y por último, la tercera columna
contiene la evaluación de la solución final en la función objetivo. A continuación, se
muestran los resultados obtenidos en cada una de las medidas de desempeño.
145
Apéndice A3
146
Tabla A31: Resultados de la optimización del MAE.
Solución
Inicial
2,2,1,1,1
5,3,1,1,1
7,6,1,1,1
2,2,2,2,2
5,3,2,2,2
7,6,2,2,2
MAE
Solución
Final
2,2,1,1,2
7,6,2,2,1
7,6,2,2,1
7,6,2,2,1
7,6,2,2,1
7,6,2,2,2
Valor
Objetivo
13.730
3.295
3.295
3.295
3.295
3.295
Tabla A32: Resultados de la optimización del MSE.
Solución
Inicial
2,2,1,1,1
5,3,1,1,1
7,6,1,1,1
2,2,2,2,2
5,3,2,2,2
7,6,2,2,2
MSE
Solución
Final
2,2,1,1,2
7,6,2,2,1
7,6,2,2,1
7,6,2,2,1
7,6,2,2,1
7,6,2,2,1
Valor
Objetivo
578.49
-47.87
-47.87
-47.87
-47.87
-47.87
Tabla A33: Resultados de la optimización de la B_Pred.
Solución
Inicial
2,2,1,1,1
5,3,1,1,1
7,6,1,1,1
2,2,2,2,2
5,3,2,2,2
7,6,2,2,2
B_Pred
Solución
Final
2,2,1,1,2
7,6,2,2,1
7,6,2,2,2
2,2,1,1,2
7,6,2,2,1
7,6,2,2,2
Valor
Objetivo
53.172
18.235
18.235
53.172
18.235
18.235
Apéndice A3
147
Tabla A34: Resultados de la optimización de la S_Pred.
Solución
Inicial
2,2,1,1,1
5,3,1,1,1
7,6,1,1,1
2,2,2,2,2
5,3,2,2,2
7,6,2,2,2
S_Pred
Solución
Final
2,2,1,1,2
7,2,2,2,1
7,6,2,2,1
2,2,1,1,2
7,2,2,2,1
7,6,2,2,1
Valor
Objetivo
91.737
48.535
6.183
91.737
48.535
6.183
Como puede observarse, existe una solución a la cual convergieron todas las medidas
de desempeño, tal solución es la (7,6,2,2,1). Esta solución nos indicó el mejor valor que
debían tomar los parámetros, para obtener un modelo de RNA con buen desempeño que
diera como resultados pronósticos confiables. Una descripción detallada se encuentra en
el Capítulo 4.
APÉNDICE B1
A continuación se muestran los pronósticos que se obtuvieron para los siguientes
doce períodos en los modelos de RNAs construidos a partir de las combinaciones de los
parámetros lags y neuronas en el diseño de experimentos. En la Tabla B11 la primera y
segunda columna contienen el valor al cual fueron fijados los parámetros lags y
neuronas respectivamente, mientras que las columnas siguientes contienen el valor del
pronóstico para doce períodos adelante.
Tabla B11: Pronóstico de los modelos de RNAs experimentales, Serie 1.
Parámetros
PRONÓSTICO
Lags
Neuronas
Mes 1
Mes 2
Mes 3
Mes 4
Mes 5
Mes 6
Mes 7
Mes 8
Mes 9
Mes 10
Mes 11
Mes 12
3
2
459
469
477
486
499
508
515
525
529
530
540
544
3
4
469
473
479
491
495
501
510
524
565
590
612
644
3
6
421
427
431
441
456
476
507
540
572
596
612
626
3
8
428
433
363
399
414
397
441
428
298
543
331
234
3
10
461
471
480
488
501
510
517
527
531
532
542
546
6
2
515
525
539
544
556
564
574
583
587
589
591
593
6
4
497
512
527
555
572
577
605
612
641
703
750
744
6
6
369
401
820
783
1,036
826
376
391
313
928
1,432
1,497
6
8
632
853
1,524
1,859
2,234
2,305
1,984
2,048
1,858
1,939
2,277
1,952
6
10
427
436
449
456
468
477
489
499
506
512
517
522
9
2
524
533
551
555
569
577
583
589
602
606
612
625
9
4
843
807
784
753
740
747
736
729
650
584
512
462
9
6
661
657
599
607
610
632
661
659
550
515
517
428
148
Apéndice B1
149
Continuación Tabla B11: Pronóstico de los modelos de RNAs experimentales, Serie 1.
Parámetros
Lags
PRONÓSTICO
Neuronas
Mes 1
Mes 2
Mes 3
Mes 4
Mes 5
Mes 6
Mes 7
Mes 8
Mes 9
Mes 10
Mes 11
Mes 12
9
8
452
460
472
477
491
500
508
518
523
525
530
536
9
10
522
386
332
260
757
383
828
704
640
905
323
1,549
12
2
526
539
561
568
582
589
598
610
635
640
650
654
12
4
617
675
741
793
871
897
944
961
982
950
947
873
12
6
464
478
487
493
505
512
521
533
540
543
551
549
12
8
464
478
487
493
505
512
521
533
540
543
551
549
12
10
464
478
487
493
505
512
521
533
540
543
551
549
15
2
586
595
604
617
625
633
638
634
647
652
672
683
15
4
471
482
490
504
512
519
535
543
548
557
562
559
15
6
471
482
490
504
512
519
535
543
548
572
562
559
15
8
471
482
490
504
512
519
535
543
548
557
562
559
15
10
471
482
490
504
512
519
535
543
548
557
562
559
APÉNDICE B2
En esta sección, se muestra el análisis de residuos de manera gráfica para cada una de
las medidas de desempeño utilizadas en la construcción del modelo de RNA para el
análisis de la Serie 1. Este análisis es utilizado para la comprobación de los supuestos de
los modelos de regresión.
En la Figura B21 se muestran los resultados del análisis de residuos del modelo de
regresión de la medida de desempeño MSE_T, que corresponde al MSE de
entrenamiento. La Figura B22 contiene los resultados del análisis de residuos para el
modelo de aproximación del MSE_V o MSE de validación.
En la Figura B21 y en la Figura B22, las gráficas de la izquierda nos permiten
comprobar el supuesto de una distribución normal en los residuos. Las gráficas de la
derecha son utilizadas para comprobar la independencia estadística en los residuos. Se
dice que se cumple el supuesto de independencia siempre y cuando el comportamiento
de los residuos no siga algún patrón reconocido.
Para comprobar el supuesto de varianza constante, se utilizan las gráficas de residuos
contra variables. La Figura B23 muestra las gráficas correspondientes a los residuos de
las medidas de desempeño MSE_T y MSE_V
experimento.
150
contra los factores utilizados en el
Apéndice B2
151
MSE_T
Probabilidad Normal
Residuos vs. Valor Ajustado
99
200
Residuo
Percentil
90
50
10
1
-500
-250
0
Residuo
250
0
-200
-400
500
0
Histograma de los Residuos
1000
1500
Valor ajustado
2000
Residuos vs. Orden de los Datos
2.0
200
1.5
Residuo
Frecuencia
500
1.0
0.5
0.0
-400
-200
0
200
Residuo
0
-200
-400
400
1
2
3
4
5
6
7
Orden de Observación
8
9
Figura B21: Gráficas de Residuos para el MSE_T, Serie 1.
MSE_V
Residuos vs. Valores Ajustados
200
90
100
Residuo
Percentil
Probabilidad Normal
99
50
10
1
-200
-100
0
Residuo
100
0
-100
-200
200
600
200
1.5
100
1.0
0
-100
0.5
0.0
1800
Residuos vs. Orden de los Datos
2.0
Residuo
Frecuencia
Histograma de los Residuos
900
1200
1500
Valor Ajustado
-200
-100
0
Residuo
100
200
-200
1
2
3
4
5
6
7
Orden de Observación
Figura B22: Gráficas de Residuos para el MSE_V, Serie 1.
8
9
152
Residuos vs. Lags
Residuos vs. Neuronas
( MSE_T)
(MSE_T)
200
200
0
0
Residuo
Residuo
Apéndice B2
-200
-200
-400
-400
3.0
4.5
6.0
7.5
9.0
2
3
Lags
Residuos vs. Lags
5
6
5
6
Residuos vs. Neuronas
(MSE_V)
(MSE_V)
200
200
100
100
Residuo
Residuo
4
Neuronas
0
-100
0
-100
-200
-200
3.0
4.5
6.0
7.5
Lags
9.0
2
3
4
Neuronas
Figura B23: Gráficas de residuos contra variables, Serie 1.
En las gráficas de las Figuras B21, B22 y B23 fue posible comprobar los supuestos
de independencia y varianza constante en los residuos, sin embargo el supuesto de
normalidad no se visualizó directamente de las gráficas de histogramas. Por esta razón
decidimos hacer una prueba formal de normalidad en los residuos. Los resultados de esta
prueba se muestran en la Figura B24.
En la Figura B24 se muestran los resultados de la prueba formal de normalidad en los
residuos para las dos medidas de desempeño utilizadas. A través de la prueba obtuvimos
el valor P que nos sirve para realizar la prueba de hipótesis en la cual se toma como
hipótesis nula que los residuos son normales y como hipótesis alternativa que no lo son.
Por esta razón, en esta prueba son deseables valores de P grandes que nos permitan
Apéndice B2
153
concluir con cierto grado de significancia que se acepta la hipótesis nula. Se observó que
para ambos casos: MSE_T y MSE_V los valores de P están por encima de 0.15, así que
con un grado de significancia menor o igual a este valor P se concluye que los residuos
cumplen con el supuesto de normalidad.
MSE_T
99
Media
7.7054E-13
Desviación Estandard
221.0
N
9
KS
0.206
Valor P
>0.150
P er centil
90
50
10
1
-500
-250
0
Residuo
250
500
MSE_V
99
Media
-8.5265E-14
Desviación Estandard 112.6
N
9
KS
0.093
Valor P
>0.150
P er centil
90
50
10
1
-300
-200
-100
0
Residuo
100
200
300
Figura B24: Resultados del análisis formal de normalidad en los residuos, Serie 1.
El análisis de los residuos resultó satisfactorio, por lo tanto concluimos que los
metamodelos (modelos de regresión) para cada medida de desempeño eran adecuados y
de acuerdo a la metodología procedimos con la fase de optimización. Ésta fase se
describe en el Capítulo 4.
APÉNDICE B3
Este apéndice contiene los pronósticos que se obtuvieron para los siguientes doce
períodos en los modelos de RNAs construidos a partir de las combinaciones de los
parámetros lags y neuronas en el diseño de experimentos, en el análisis de la serie 2. En
la Tabla B31, la primera y segunda columna contienen el valor al cual fueron fijados los
parámetros lags y neuronas respectivamente, mientras que las columnas siguientes
contienen el valor del pronóstico para doce períodos adelante.
Tabla B31: Pronóstico de los modelos de RNAs experimentales, Serie 2.
Parámetros
Lags Neuronas
PRONÓSTICO
Mes 1
Mes 2
Mes 3
Mes 4
Mes 5
Mes 6
Mes 7
Mes 8
Mes 9
Mes 10
Mes 11
Mes 12
3
2
104.66
108.00
115.00
122.00
129.00
134.81
140.58
146.85
154.29
157.00
164.00
170.00
3
4
104.65
108.00
117.00
123.00
131.00
135.00
141.13
145.36
154.40
157.00
168.00
175.00
3
6
76.97
79.40
83.00
86.00
90.00
93.06
96.74
100.53
100.96
100.00
104.00
107.00
4
2
76.12
80.20
82.00
84.20
86.30
89.89
93.82
96.63
97.21
101.00
101.00
99.30
4
4
101.59
106.00
110.00
114.00
120.00
130.01
140.85
150.66
162.12
173.00
190.00
193.00
4
6
76.12
80.20
82.00
84.20
86.30
89.89
93.82
96.63
97.21
101.00
101.00
99.30
6
2
48.40
51.00
53.40
57.10
62.50
66.89
67.83
70.10
84.95
99.40
108.00
111.00
6
4
79.42
81.50
83.30
86.60
90.40
94.28
96.75
99.82
99.83
99.90
99.90
102.00
6
6
79.42
81.50
83.30
86.60
90.40
94.28
96.75
99.82
99.83
99.90
99.90
102.00
Puesto que se observó que el área experimental podía redefinirse para obtener
metamodelos más confiables, se desarrolló el nuevo experimento, los resultados están
contenidos en el Apéndice B4.
154
APÉNDICE B4
En este apartado se muestran los pronósticos que se obtuvieron para los siguientes
doce períodos en los modelos de RNAs construidos a partir de las combinaciones de los
parámetros lags y neuronas en el diseño de experimentos para la Serie 2, considerando
el experimento enfocado.
En la Tabla B41 la primera y segunda columna contienen el valor al cual fueron
fijados los parámetros lags y neuronas respectivamente, mientras que las columnas
siguientes contienen el valor del pronóstico para doce períodos adelante.
Tabla B41: Pronóstico de los modelos de RNAs experimentales, experimento enfocado
Serie 2.
Parámetros
Lags Neuronas
3
3
PRONÓSTICO
Mes 1
Mes 2
Mes 3
Mes 4
Mes 5
Mes 6
106.28
109.71
118.95
120.54
128.85
136.65
Mes 7
Mes 8
Mes 9
Mes 10
Mes 11
Mes 12
145.4
148.25
155.69
159.68
166.86
171.14
3
4
102.04
105.55
116.29
117.84
127.17
135.43
144.6
146.95
157.99
167.88
175.81
181.01
4
3
101.91
107.01
111.63
116.05
126.02
137.16
147.53
154.57
163.54
185.51
192.26
195.46
4
4
115.81
108.39
111.76
116.68
127.49
135.91
145.75
160.64
170.83
159.11
164.17
195.75
5
3
157.66
163.35
162.21
164.39
165.14
166.00
173.06
176.37
185.98
191.06
205.49
211.70
5
4
105.01
111.30
114.72
116.7
119.56
124.21
129.30
132.27
140.11
146.20
138.92
130.82
6
3
137.81
143.69
155.9
164.2
181.03
196.35
203.54
220.6
318.36
339.13
291.13
303.64
6
4
131.26
133.78
155.8
171.82
182.96
189.35
190.26
188.89
194.03
196.83
195.02
199.63
155
APÉNDICE B5
En esta sección, se muestra el análisis de residuos de manera gráfica para cada una de
las medidas de desempeño utilizadas en la construcción del modelo de RNA. Este
análisis es utilizado para la comprobación de los supuestos de los modelos de regresión.
La Figura B51, B52 y B53 contienen las gráficas de residuos correspondientes a los
modelos de regresión que aproximan las medidas de desempeño MSE_T y MSE_V .En
la Figura B51 y en la Figura B52, las gráficas de la izquierda permiten la comprobación
del supuesto de normalidad, las de la derecha se utilizan para la comprobación del
supuesto de independencia estadística.
156
Apéndice B5
157
MSE_T
Probabilidad Normal
Residuos vs. Valores Ajustados
99
10
Residuo
Percentil
90
50
10
5
0
-5
1
-10
0
Residuo
10
70
Histograma de los residuos
100
Residuos vs. Orden de los Datos
3
10
2
Residuo
Frecuencia
80
90
Valor A justado
1
5
0
-5
0
-12
-8
-4
0
4
Residuo
8
12
1
2
3
4
5
6
Orden de Observación
7
8
Figura B51: Gráficas de Residuos para el MSE_T, Serie 2.
MSE_V
Residuos vs. Valores Ajustados
80
90
40
Residuo
Percentil
Probabilidad Normal
99
50
10
1
-100
-50
0
Residuo
50
0
-40
-80
100
200
80
1.5
40
1.0
0
-40
0.5
0.0
500
Residuos vs. Orden de los Datos
2.0
Residuo
Frecuencia
Histograma de los Residuos
300
400
Valor A justado
-80
-40
0
Residuo
40
80
-80
1
2
3
4
5
6
Orden de Observación
Figura B52: Gráficas de Residuos para el MSE_V, Serie 2.
7
8
Apéndice B5
158
Residuos vs. Lags
Residuos vs. Neuronas
( MSE_T )
( MSE_T)
10
5
5
Residuo
Residuo
10
0
0
-5
-5
3
4
5
6
3
4
Lags
Neuronas
Residuos vs. Lags
Residuos vs. Neuronas
(MSE_V)
80
40
40
Residuo
Residuo
(M SE_V)
80
0
-40
0
-40
-80
-80
3
4
5
6
3
Lags
4
Neuronas
Figura B53: Gráficas de residuos contra variables, Serie 2.
Para comprobar el supuesto de varianza constante, nos auxiliamos de las gráficas de
residuos contra factores. Estas gráficas se muestran en la Figura B53.
Analizando las gráficas de las Figuras B51, B52 y B53, concluimos que los supuestos
de independencia estadística y varianza constante en los residuos de los modelos de cada
medida de desempeño utilizada fueron cumplidos, sin embargo, a prueba de normalidad
no era muy clara en los histogramas. Hicimos una prueba formal de normalidad en los
residuos para asegurarnos que los metamodelos eran adecuados para describir nuestras
medidas de desempeño y de esta manera continuar con la metodología. En la Figura B54
se muestran los resultados obtenidos, la interpretación de los mismos es similar a la de la
Figura B23 del Apéndice B2. Pudo observarse que para un nivel de significancia menor
a 0.15 se concluye que los residuos cumplen con el supuesto de normalidad, para ambas
medidas de desempeño. Concluimos que los metamodelos son adecuados y proseguimos
con la metodología, se sugiere consultar el Capítulo 5.
Apéndice B5
159
MSE_T
99
P er centil
90
Media
-2.1205E-14
Desviación Estandard 6.128
N
8
KS
0.198
Valor P
>0.150
50
10
1
-1 5
-1 0
-5
0
Residuo
5
10
15
MSE_V
99
P er centil
90
Media
-6.2438E-13
Desviación Estandard 44.53
N
8
KS
0.156
Valor P
>0.150
50
10
1
-1 0 0
-5 0
0
Residuo
50
100
Figura B54: Resultados del análisis formal de normalidad en los residuos, Serie 2.
APÉNDICE C
A continuación se presenta el Código fuente en lenguaje Matlab, que fue construido
para la instauración de la herramienta de toma de decisiones.
Los siguientes cuatro programas constituyen la columna vertebral del generador y
ejecutor del Diseño de Experimentos Factorial, posteriormente se muestra el código
utilizado para las inicializaciones múltiples.
Programa: Hacer_Experimento.m
Función:
Se encarga de generar y ejecutar un Diseño de Experimentos de tipo factorial,
considerando como factores el parámetro Lags y Neuronas.
Entradas:
1.-Conjunto de datos históricos (serie de tiempo)
2.-Posibles valores del parámetro lags
3.-Posibles valores del parámetro neuronas
4.-Nombre del archivo.xls donde se imprimiran los resultados del experimento
160
Apéndice C
Código Fuente:
function Hacer_Experimento(info,lags,neuronas,archivo)
%Indica la cantidad de periodos que se desean pronosticar
% Corresponde al número de neuronas en la capa de salida
periodos=12;
%Algoritmo de entrenamiento,(retropropagación del error)
alg='trainlm';
%Cardinalidad del conjunto de patrones que se utilizarán para validación
dim_v=15;
%Cantidad de actualizaciones de los pesos en la RNA
epocas=1200;
% Será utilizado como identificador de los archivos en los que se
% almacenarán los modelo de RNA para cada combinación factorial
total=1;
%Obtención de la cantidad de niveles en cada factor
[nivel_l,y]=size(lags);
[nivel_n,r]=size(neuronas);
%Para asegurarse que la variable nivel_x tiene el número correcto de
%niveles de la variable x
if nivel_l<y
nivel_l=y;
end
if nivel_n<r
nivel_n=r;
end
161
Apéndice C
162
%Los resultados del experimento se van a almacenar en un archivo, éste
%contendrá los valores que obtienen las medidas de desempeño así como los nombres
de los archivos que contienen la información completa del %modelo de red
correspondiente a la prueba.
% Abre el archivo.xls para imprimir en el el resultado del experimento
%Se imprimirá los valores específicos de cada Factor experimental
resultado=fopen(archivo,'a+')
if resultado==-1
printf('Error, no se pudo crear el archivo\n');
exit(1);
else
fprintf(resultado,'Experimento realizado con lags a %d niveles y neuronas a %d
niveles\n',nivel_l,nivel_n);
fprintf(resultado,'\nLags\n')
fprintf(resultado,'%d\n',lags);
fprintf(resultado,'\nNeuronas\n')
fprintf(resultado,'%d\n',neuronas);
fprintf(resultado,'\nArchivo\t\tInicio\t\tLags\t\tNeuronas\t\tMSE_Training\t\tMSE_Valida
tion\t\tMSE_RandomWalk\n');
fprintf(resultado,'\n');
fclose(resultado);
end
%Ciclo que se encarga de generar una a una las combinaciones factoriales
%Fija el factor Lags y recorre el Factor neuronas
for i=1:nivel_l
%Llama la función que se encarga de generar las matrices que contendrán
Apéndice C
163
%los patrones de entrenamiento y validación
[P,T,P_V,T_V,indices_v,indices_t,t]=seleccion(info,lags(i),periodos,dim_v);
%Ciclo para cambiar el valor del factor neuronas
for j=1:nivel_n
%Llama a la Función prediccion_m que se encarga de entrenar y validar un conjunto de
RNAs utilizando diferentes inicializaciones en los pesos de las conexiones.
%Esta Función regresa la mejor de las RNAs creadas.
%Selecciona como mejor RNA aquella con menor error de validación
%Devuelve además, el valor del pronóstico, las medidas de desempeño
%asociadas y un identificador para determinar el tipo de inicialización
%utilizada.
[pos,forecast,MSE_RandomWalk,MSE_Training,MSE_Validation,mejor]
prediccion_m(info,P,T,P_V,T_V,lags(i),neuronas(j),epocas,alg,periodos);
%Selecciona la funcion de inicializacion
switch(pos)
case 1
inicio='initzero';
case 2
inicio='midpoint';
case 3
inicio='rands';
case 4
inicio='inicio_med1';
case 5
=
Apéndice C
164
inicio='inicio_med2';
case 6
inicio='inicio_min';
case 7
inicio='inicio_max',
end
%Renombrar el archivo que contiene la información completa de la red que
%generó estos resultados en las medidas de desempeño
nuevo_nombre=strcat(int2str(total),'.mat');
movefile(mejor,nuevo_nombre);
total=total+1;
%Imprime en el archivo.xls los resultados correspondientes
resultado=fopen(archivo,'a+');
if resultado==-1
printf('Error al accesar al archivo');
exit(1);
else
fprintf(resultado,'%s\t\t%s\t\t%d\t\t%d\t\t%.4f\t\t%.4f\t\t%.4f\t\t%.4f\t\t',nuevo_nombre,i
nicio,lags(i),neuronas(j),MSE_Training,MSE_Validation,MSE_RandomWalk,forecast);
fprintf(resultado,'\n');
end
fclose(resultado);
Apéndice C
165
clear nuevo_nombre;
end
end
Programa: seleccion.m
Función:
Es utilizada para crear los patrones disponibles dependiendo de las observaciones
disponibles.
Los patrones son separados en dos conjuntos, uno de validación y otro de entrenamiento
para el diseño de una RNA.
El primero es seleccionado de manera aleatoria, de acuerdo a una distribución uniforme
sin reemplazo.
Entradas:
1.-observaciones: vector columna que contiene la serie de tiempo
2.-lags: cantidad de datos históricos
3.-periodos:cantidad de neuronas de salida (pronósticos)
4.-cantidad: cardinalidad de patrones de validación
Código Fuente:
function
[P,T,P_V,T_V,posiciones_v,posiciones_t,t]
(observaciones,lags,periodos,cantidad)
%obtiene la cantidad de datos en la serie de tiempo
=
seleccion
Apéndice C
[n,m]=size(observaciones);
if m>n
n=m;
observaciones=observaciones';
end
%Para crear matrices temporales devuelve matriz de lagsXQ y 12XQ
temp_P=crear(observaciones(1:n-periodos,1),lags);
temp_T=crear(observaciones(lags+1:n,1),periodos);
[r,t]=size(temp_P);
%Crea un vector con las posiciones de los patrones que se utilizarán para
%el conjunto de validación, de acuerdo a una distribución uniforme sin
%reemplazo
validacion=randsample(t,cantidad);
validacion=sort(validacion);
posiciones_v=validacion';
c=1;
ban=0;
d=1;
%Se crean las matrices de los patrones de validación
%P_V serán las entradas y T_V las salidas, juntos forman los patrones de
%validación
P_V=temp_P(:,validacion);
T_V=temp_T(:,validacion);
166
Apéndice C
167
%En el siguiente ciclo, se seleccionan de los patrones disponibles,
%aquéllos que no forman parte del conjunto de validación
for i=1:t
if (c<=cantidad & i== validacion(c))
c=c+1;
ban=1;
end
if ban==0
P(:,d)=temp_P(:,i);
T(:,d)=temp_T(:,i);
posiciones_t(d)=i;
d=d+1;
else
ban=0;
end
end
t=n;
Programa: prediccion.m
Función:
Utiliza las matrices P y T definidas con anterioridad, esto es cuando ya se han elaborado
los valores estimados de las ultimas observaciones P es matriz de lagsx(n-lags) y T es
matriz de Periodosx(n-lags) Inicializa de 7 formas distintas los pesos de la red con cada
una de estas formas se entrena y valida la red. Luego se comparan todos los MSE_V para
regresar la red que tiene el menor de todos.
Apéndice C
168
Considera caminata aleatoria para comparar los resultados
Entradas:
1.- info: incluye toda la informacion que incluye P, T, P_V y T_V
2.- lags: cuantos datos historicos se desean considerar para el pronostico
3.- neuronas: cuantas neuronas contendra la capa oculta de la red
4.- epocas: parametro de finalizacion del entrenamiento
5.- alg: algoritmo de entrenamiento
6.- periodos: horizontes de prediccion
Código Fuente:
function
[pos,next,MSE_RandomWalk,MSE_T,MSE_V,mejor]
prediccion_m(info,P,T,P_V,T_V,lags,neuronas,epocas,alg,periodos)
%Estos arreglos de cadenas se utilizaran para almacenar cada uno de los
%resultados de las redes creadas en archivos con diferentes nombres, aux2
%representa el tipo de inicializacion de pesos de la red, aux se utiliza
%cuando se quieren realizar hasta 10 replicas con la misma inicializacion
aux={'11';'12';'13';'14';'15';'16';'17';'18';'19';'20'};
aux2={'cero';'midp';'rand';'med1';'med2';'_min';'_max'};
aux2=char(aux2);
aux=char(aux);
%Cálculo de MSE de Random Walk
MSE_RandomWalk=ErrorRandWalk(info)
=
Apéndice C
169
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% PREPROCESAMIENTO DE DATOS
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%Obtencion del valor minimo y maximo de las observaciones
[x,y]=size(info)
minimo=min(info);
maximo=max(info);
%Aquí periodos indica cuantos se van a predecir en la red
%Para obtener la informacion que realmente se utilizo al crear P y T
datas=info(:,1);
ultimos=zeros(periodos,1);
t=x;
%Los datos de la serie son escalados a [-1, 1], para futuras referencias
conjunto=2.*(datas-minimo)./(maximo-minimo)-1;
%El valor de t es para registrar en total cuantos datos considere para formar P y T.
clear info;
%Los elementos de las matrices de patrones de entrenamiento y validación
%se escalan a [-1, 1]
P=2.*(P-minimo)./(maximo-minimo)-1;
T=2.*(T-minimo)./(maximo-minimo)-1;
P_V=2.*(P_V-minimo)./(maximo-minimo)-1;
Apéndice C
T_V=2.*(T_V-minimo)./(maximo-minimo)-1;
for i=1:7
%El peor de los casos el MSE_V tendrá este valor
MSE_Val(1)=10000000000;
contador=1;
corrida=1;
switch(i)
case 1
inicio='initzero';
case 2
inicio='midpoint';
case 3
inicio='rands';
corrida=3;
case 4
inicio='inicio_med1';
case 5
inicio='inicio_med2';
case 6
inicio='inicio_min';
case 7
inicio='inicio_max',
170
Apéndice C
171
end
actual=contador;
nombres(contador,:)=strcat(aux2(i,:),aux(contador,:));
nombres=char(nombres);
%Llama a la funcion que crea, entrena y valida una red de múltiples
%salidas, indicando la inicialización de pesos, los patrones de
%entrenamiento y validación así como el algoritmo de entrenamiento
[next_ind(contador,:),MSE_Val(contador),MSE_Train(contador)]=red_multiple(inicio,al
g,nombres(contador,:),P,T,P_V,T_V,neuronas,periodos,t,epocas,minimo,maximo,conjun
to,ultimos,datas,i);
min_next=min(next_ind(contador,:));
%Si los pronósticos obtenidos por la RNA no tienen sentido, es decir son
%negativos, entonces se le pone al modelo de RNA correspondiente un valor
%de MSE_V muy grande con el propósito de que no sea atractivo para la
%selección del mejor modelo.
if min_next<0
MSE_Val(contador)=1000000000000;
end
contador=contador+1;
actual=contador-1;
cont=contador
%Para guardar en archivos con nombres que se utilicen para referenciar
%posteriormente los archivos de las RNAs creadas, de acuerdo a la
%inicialización utilizada. Así como las medidas de desempeño obtenidas
%en cada RNA para posteriormente obtener la mejor de ellas.
[chico,pos]=min(MSE_Val);
Apéndice C
172
for e=1:contador-1
nombre=strcat(nombres(e,:),'.mat');
if e~= pos
delete (nombre);
else
mejores(i,:)=nombre;
MSE_Training(i)=MSE_Train(e);
MSE_Validation(i)=MSE_Val(e);
forecast(i,:)=next_ind(e,:);
end
clear nombre;
end
clear nombres MSE_Val MSE_Train next_ind;
end %Cierra for
%Para obtener la red que tuvo el MSE_Validation mas pequeño de todas
%las inicializaciones, esa es la informacion que regresa esta función
%Una RNA con mejor desempeño,los valores del MSE_T y MSE_V, el
%pronóstico y el tipo de inicialización utilizada en esa RNA
[menor,pos]=min(MSE_Validation);
for e=1:i
nombre=mejores(e,:);
nombre=char(nombre);
if e~= pos
delete (nombre);
Apéndice C
173
else
mejor=nombre;
MSE_T=MSE_Training(e);
MSE_V=MSE_Validation(e);
next=forecast(e,:);
end
clear nombre;
end
clear mejores MSE_Training MSE_Validation forecast e menor;
Programa: red_multiple.m
Función:
Crea una red neuronal para prediccion de multiples periodos, inicializa los pesos de
manera sistemática, entrena, valida y predice.
Almacena los resusltados del modelo de RNA en un archivo.m
Regresa el pronóstico y el valor de las medidas de desempeño MSE_V y MSE_T.
Entradas:
1.- Inicio: indica que función de inicialización de pesos va a utilizar para crear el modelo
de RNA.
2.- alg: Corresponde al algoritmo de entrenamiento
3.- nombre del archivo donde almacenará los resultados.
4.-Matrices P, T, P_V y T_V que contienen patrones de entrenamiento y
Apéndice C
174
patrones de validación del modelo.
5.- Otros que ayudan al funcionamiento de la función.
Esta función es utilizada por la función prediccion_m
Código Fuente:
function
[next,MSE_Validation,MSE_Training]
=
red_multiple(inicio,alg,nombre,P,T,P_V,T_V,neuronas,periodos,t,epocas,minimo,maxi
mo,conjunto,ultimos,datas,ind)
%calcular las dimensiones de P
[m,n]=size(P);
%Creacion de indices para identificar las observaciones
lags=m;
i=1:lags;
total=1:t;
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%DEFINICION DE LA RED
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%Define una RNA feedforward con retropropagación
red=newff(minmax(P),[neuronas,periodos],{'tansig','purelin'},alg);
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%
Apéndice C
175
%INICIALIZACION DE LOS PESOS DE LAS CONEXIONES
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
red.initFcn='initlay';
%%%%%%%%%%%
%Para que llame a la función inicio que se encargará de colocar los
%valores iniciales en las conexiones de la RNA
red.layers{1}.initFcn='initwb';
red.layers{2}.initFcn='initwb';
%Inicializa los pesos, de acuerdo a la función que se indica por ‘inicio’
red.inputWeights{1,1}.initFcn=inicio;
red.layerWeights{2,1}.initFcn=inicio;
red.biases{1}.initFcn=inicio;
red.biases{2}.initFcn=inicio;
red=init(red);
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%
% ENTRENAMIENTO
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%====================================
% Definición de Criterios de parada
%====================================
%Por número de épocas o actualizaciones de los pesos
Apéndice C
176
red.trainParam.epochs =epocas;
%Por alcanzar la aproximación deseada
red.trainParam.goal =1e-5;
%Llama a la función train para entrenar la red, recibe la matriz de entrada %y la matriz
de valores target.
red=train(red,P,T);
%Simulacion utilizando el conjunto de entrenamiento
a=sim(red,P);
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%POSTPROCESAMIENTO DEL CONJUNTO DE ENTRENAMIENTO Y DEL
%RESULTADO DE LA SIMULACION
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%Transformación inversa para regresar los datos a su escala natural
P=minimo+.5.*(P+1).*(maximo-minimo);
A=minimo+.5.*(a+1).*(maximo-minimo);
T=minimo+.5.*(T+1).*(maximo-minimo);
%======================================
% OBTENCION DE ERROR DE ENTRENAMIENTO
%======================================
Apéndice C
177
%Cálculo de la matriz de errores
Errors=T-A;
%Obtencion del MSE del conjunto de entrenamiento
MSE_Training=MSE(Errors)
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%
% VALIDACIÓN
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%
validacion=sim(red,P_V);
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% POSTPROCESAMIENTO DEL CONJUNTO DE VALIDACION
% Y DEL RESULTADO DE LA SIMULACION
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%Transformacion inversa para regresar los datos a su escala natural
P_V=minimo+.5.*(P_V+1).*(maximo-minimo);
V=minimo+.5.*(validacion+1).*(maximo-minimo);
T_V=minimo+.5.*(T_V+1).*(maximo-minimo);
%======================================
%
OBTENCION DE ERROR DE VALIDACION
Apéndice C
178
%======================================
%Cállculo de la matriz de errores
Errors_V=T_V-V;
%Obtencion del MSE del conjunto de entrenamiento
MSE_Validation=MSE(Errors_V)
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%
OBTENCION DE MATRICES DE PESOS FINALES
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%
%Pesos que unen las entradas con las neuronas de la capa oculta
W1_red=red.IW{1,1};
%Bias de la capa oculta
B1_red=red.b{1,1} ;
%Pesos que van de la capa oculta (1) a la capa de salida (2)
W2_red=red.LW{2,1} ;
%Bias de la capa de salida
B2_red=red.b{2,1};
%Considera las ultimas lags observaciones para predecir los siguientes %periodos;
nuevos=conjunto(t-lags+1:t,1)
%Predice los siguientes y los guarda en next
next=sim(red,nuevos);
Apéndice C
179
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%
%POST-PROCESAMIENTO DEL PRONÓSTICO
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%
next=minimo+.5.*(next+1).*(maximo-minimo);
err_p=ultimos-next;
MSE_Pred1=MSE(err_p);
clear ind d ;
save (nombre);
A continuación se presenta la información correspondiente a las funciones de
inicialización que fueron creadas para inicializar los pesos de las conexiones de la RNA
de manera sistemática.
Funciones De Inicialización De Pesos
Los siguientes programas son el código de las funciones de inicialización de pesos
que fueron utilizadas en la construcción de las RNAs
Inicialización de los pesos en 0.
Se utilizó la función initzero que viene incluida en Matlab
Inicialización en un punto medio en el intervalo [-1,1].
Se utilizó la función midpoint que viene en Matlab
Apéndice C
180
Inicialización aleatoria en el intervalo [-1, 1].
Se utilizó la función rands que viene en Matlab
Inicialización de pesos en -0.5.
function w= inicio_med1(s,pr)
%Funcion de inicializacion de los pesos de las conexiones de la red
%Inicializa en - 0.05
if nargin < 1, error('No hay argumentos de entrada'), end
if nargin == 1
w =rand(s,1).*0-0.5; % <-- colocamos nuestros propios valores iniciales, vector de
pesos
else
r = size(pr,1);
% <-- propios valores en caso de ser una matriz de pesos
w = rand(s,r).*0-0..5;
end
Inicialización de pesos en 0.5.
function w= inicio_med2(s,pr)
%Funcion de inicializacion de los pesos de las conexiones de la red %Inicializa en 0.5
if nargin < 1, error('No hay argumentos de entrada'), end
if nargin == 1
w =rand(s,1).*0+0.5; % <-- colocamos nuestros propios valores iniciales, vector de
pesos
else
r = size(pr,1);
% <-- propios valores en caso de ser una matriz de pesos
Apéndice C
181
w = rand(s,r).*0+0..5;
end
Inicialización de pesos en -1.
function w= inicio_min(s,pr)
%Funcion de inicializacion de los pesos de las conexiones de la red %Inicializa en -1
if nargin < 1, error('No hay argumentos de entrada'), end
if nargin == 1
w =rand(s,1).*0 -1; % <-- colocamos nuestros propios valores iniciales, vector de
pesos
else
r = size(pr,1);
% <-- propios valores en caso de ser una matriz de pesos
w = rand(s,r).*0 -1;
end
Inicialización de pesos en 1.
function w= inicio_max(s,pr)
%Funcion de inicializacion de los pesos de las conexiones de la red %Inicializa en 1
if nargin < 1, error('No hay argumentos de entrada'), end
if nargin == 1
w =rand(s,1).*0+1; % <-- colocamos nuestros propios valores iniciales, vector de
pesos
else
r = size(pr,1);
% <-- propios valores en caso de ser una matriz de pesos
Apéndice C
182
w = rand(s,r).*0+1;
end
Los programas que se presentan en este Apéndice son los que utilizamos en el
desarrollo de la metodología del Capítulo 3 para crear una RNAs con múltiples salidas.
Se sugiere ver resultados en el Capítulo 5.
AUTOBIOGRAFÍA
MARÍA ANGÉLICA SALAZAR AGUILAR Candidata para el grado de maestro en Ciencias en Ingeniería de Sistemas
Universidad Autónoma de Nuevo León
Facultad de Ingeniería Mecánica y Eléctrica
Tesis
“PRONÓSTICO DE DEMANDA POR MEDIO DE REDES NEURONALES ARTIFICIALES (RNAs) EN LA INDUSTRIA DE TELECOMUNICACIONES”
Nacida en Querétaro, Querétaro. Hija primogénita del Sr. J. Guadalupe Salazar
Galindo y la Sra. Consuelo Aguilar Cárdenas. Graduada en el Instituto Tecnológico de
Querétaro como Ingeniero en Sistemas Computacionales (1999-2003). Participó en el
XIII Verano de Investigación Científica organizado por la Academia Mexicana de
Ciencias, durante este período trabajó en la FIME de la UANL en el PISIS bajo la tutela
del Dr. Roger Z. Ríos Mercado. Inició sus estudios de Maestría en Ciencias en
Ingeniería de Sistemas en Enero de 2004 con el apoyo del PISIS y una beca de
manutención otorgada por el CONACYT. En Septiembre de 2005 realizó una estancia
de intercambio académico en la Ohio State University en colaboración con el Dr.
Mauricio Cabrera Ríos y el Dr. José M. Castro.
183