Download Las variables retardadas como instrumento

Document related concepts
no text concepts found
Transcript
Las variables retardadas como instrumento econométrico para cuantificar en el corto y
largo plazo el efecto de una política pública en la economía y para
identificar y
eliminar la presencia de la autocorrelación en MCO.
Genaro Sánchez Barajas es Ph. D. por la Russian Academy of Sciences, profesor en la
licenciatura y en la maestría en economía y tutor en los doctorados de Economía y de
Ciencias de la Administración de la UNAM.
Domicilio: Cubículo 15, Edificio A de la
Facultad de Economía, Cd. Universitaria, D.F.Celular: 55 1473 2231; correo:
[email protected], celular 55 14732231
Clasificación Jel: C4 - Econometric and Statistical Methods: Special Topics;
Palabras clave:
políticas públicas, variables autorregresivas, autocorrelación, corto,
largo plazo.
Resumen: El método de las variables retardadas
es muy importante dentro de las
políticas públicas económicas y de la econometría empírica porque su aplicación además
de corregir la violación que produce la autocorrelación en MCO, proporciona el periodo
de tiempo que dura el impacto que suelen tener las políticas públicas por medio de
variables específicas en la economía; un ejemplo lo proporciona la inversión en activos
fijos, cuyo efecto no termina en el siguiente año en que la planta productiva entra en
operación, sino que se prolonga por varios años más. Otro ejemplo es el ingreso de las
personas de hace dos años que incide en su ingreso del año pasado y en el de este año;
también, la inflación del mes pasado indudablemente incide en la inflación de este mes, etc.
Como puede observarse, este método es muy útil para hacer planeación económica porque
aporta a las autoridades y/o ejecutivos de las empresas, el periodo que dura el efecto que
tiene una política pública o privada sobre las variables que se desean afectar positiva o
negativamente.
Como se intuye, la aplicación de este método no se hace con datos de corte transversal, es
fundamentalmente con datos de series de tiempo de variables económicas ya que su uso se
sustenta en la observación que por lo general el impacto de algunas variables exógenas
sobre las endógenas no termina en un punto en el tiempo, sino que se prolonga a un periodo
mucho más largo. En este contexto es que decimos que los efectos diferidos en el tiempo se
incorporan en un modelo econométrico mediante el uso de “variables retardadas o
rezagadas” . Por otra parte, en MCO dichos efectos pueden indicar autocorrelación o
dependencia entre los términos de error Ui de los años sucesivos de la serie bajo estudio.
Al respecto, dichos efectos pueden expresarse de dos maneras diferentes, las cuales son:
I.- Por medio de modelos autorregresivos.
En este caso si se define a Y como el ingreso incluido en un modelo econométrico como
variable endógena, su incidencia progresiva en el tiempo (t) se cuantifica por medio de su
uso ahora como variable exógena pero retardada en algún periodo determinado, digamos
anualmente, misma que se denota como Yt-1 o Y(-1), donde (-1) se conoce como rezago o
retardo de un año; igualmente, en ese sentido digamos Yt-3 o Y(-3) indica que Y ha sido
rezagada o retardada tres años, estos valores ahora pueden usarse como variables
explicativas de Y en tres años. Así, en general sirven para mostrar el efecto que ejercen en
el tiempo (Yt-1 , Yt-2,Yt-3, …..Yt-n ) sobre Y.
II. -Por medio de modelos de retardos distribuidos: finitos e infinitos.
A diferencia de los modelos autorregresivos, en estos son las variables explicativas X1,
X2………Xn las que ejercen impactos o efectos prolongados en el tiempo sobre la variable
dependiente o endógena Y. Dicho lo anterior, ahora primero se ilustra el cálculo del efecto
que tienen una política pública usando sólo una variable exógena que denominaremos X1
sobre otra endógena que representaremos con Y.( Sánchez et al, 2015).
II.1.- Cálculo del efecto de una política pública sobre la economía usando modelos con
retardos distribuidos: finitos. .
Modelos con retardos distribuidos finitos
El cálculo del efecto de la variable independiente o exógena, digamos X1 sobre la
dependiente o endógena, Y, se hace mediante el uso de un
número determinado de
retardos necesarios para cuantificar en el tiempo dicho efecto. El problema de determinar el
número de retardos (¿cuántos? ) sabiendo que X1 ejerce un efecto prolongado sobre la
variable dependiente Y en el tiempo, se soluciona corriendo el modelo varias veces con X1
retardada y definiendo a M como el número finito de retardos que viene a indicar “el
número de periodos en los que se mantiene el efecto” ( Carrascal, et al, 2001:307).
Ejemplo usando Eviews, los M retardos se escriben en la caja de diálogo así: X1(-1), X2(2),X3(-3),…..,XM(-M); por eso se le llama también “longitud del retardo”. Luego que se
obtienen los resultados de los diferentes modelos que se hayan corrido, se deben de
comparar entre sí y enseguida seleccionar aquel modelo cuya R2 ajustado sea mayor y que
muestre el menor valor en los criterios de información de AKAIKE y SCHWARZ.
Así, corriendo cada modelo con M retardos, con Eviews supóngase que si deseamos
conocer el efecto prolongado de X1: INGRESO sobre Y: CONSUMO y si tenemos 12 años
de datos para cada una de esas variables, entonces corremos en este caso con un número
diferente de retardos el modelo siete veces y sus valores se registran en la siguiente tabla:
M: número de T: Número de R2 ajustado
Criterio
retardos
datos
AKAIKE
SCHWARZ
0
12
0.7391
4.26
4.34
1
11
0.7766
4.03
4.14
2
10
0.8834
3.30
3.40
3
9
0.8937
3.15
3.22
4
8
0.9151
2.91
2.94
5
7
0.8436
3.44
3.42
6
6
0.7469
3.75
3.65
de Criterio
de
De acuerdo con estos resultados estadísticos, se escoge el modelo que fue corrido con 4
retardos de la variable independiente X1, puesto que es el que presenta el mayor valor para
el coeficiente de determinación ajustado como el menor valor de los indicadores de
Akaike y Schwarz (Carrascal et al, 2001: 310 ).
Interpretación: De acuerdo con estos resultados,
el efecto prolongado de X1 sobre Y es
de cuatro años.
III.
Identificación de
la presencia o ausencia de autocorrelación con variables
retardadas, cuya eliminación sienta las bases para calcular el efecto de la variable
independiente en la variable dependiente en el corto y largo plazo.
III.1- Modelos autorregresivos usados para detectar autocorrelación con h llamada “
Contraste h de Durbin”, definiendo a Y como consumo, X1: ingreso y
inflación, de los últimos 30 meses, cuya base de datos es la siguiente:
Observación Y
X1
X2
1
3
1
8
2
2
2
15
3
4
2.5
10
4
5
3
9
5
5
4
7
6
7
5
6
7
6
7
8
8
8
8
4
9
9
9
3
10
12
15
1
11
12.2 16
12
12.4 13.5 4
13
12.1 13.6 3.5
14
12.5 14.2 4.6
15
12.9 16.5 2.3
16
13.8 16.2 4.2
17
14.1 18.6 3.9
18
13.1 19.3 5.2
19
13
20
13.2 18.6 3.19
21
13.3 15.6 4.6
22
13.4 19.2 3.9
23
13.5 13.6 4.2
24
14.1 15.6 4.5
1.5
17.2 4.1
X2 como
25
14.2 17.5 3.1
26
14.3 16.2 5.3
27
14.4 14.2 4.2
28
15
16.2 4.3
29
15.2 16.6 3.8
30
15.6 17.5 4
Fuente: Investigación propia
Al respecto, Carrascal et al (2001: 294) indica que si usamos los modelos autorregresivos
es porque “suponen una violación de una de las hipótesis establecidas en el modelo de
regresión lineal clásico. Concretamente, la hipótesis de que los regresores no son
aleatorios, ya que la variable endógena retardada depende de la perturbación aleatoria y,
por tanto, tiene un carácter estocástico”. Es por eso que cuando hay regresores
estocásticos: Y (-1) que la estadística d de
Durbin Watson ya no es apropiada para
identificar la autocorrelación que pueda existir entre la variable endógena Y (-1) retardada
y la perturbación aleatoria (Ui).
César Pérez (2007: 129) es más parco, no dice por qué usar h, simplemente informa que “
El estadístico de Durbin Watson no debe utilizarse para modelos que introducen retardos en
la variable dependiente ni para modelos sin término constante.”
Por consiguiente, continuando con Carrascal et al ( 2001:294),
es importante mencionar
que con este método las estimaciones están en función del tipo de dependencia en el
tiempo que se detecte entre la variable estocástica Y(-1) y las Ui´s, es decir, depende del
tiempo que dure su efecto sobre Y. Cuando es parcial ( en tiempo pasado pero no en el
presente y menos en el futuro) se dice que los estimadores sólo dependen de las
perturbaciones en periodos de tiempo pasados, de manera que mantienen su propiedad de
consistencia pero pierden la de insesgabilidad, por lo que pero aun así pueden seguirse
usando. Sin embargo, cuando la dependencia es total (siempre) los regresores estocásticos
dependen de las perturbaciones en todos los periodos (ídem), tal que en este caso pierden
las dos propiedades antes mencionadas y se busca un método de estimación alterno para
que el estimador cuando menos contenga la propiedad de consistencia, el cual puede ser el
de variables instrumentales, ya que
con éste se garantiza la propiedad asintótica de
consistencia en las estimaciones con mínimos cuadrados ordinarios (MCO). En
consecuencia, se infiere que cuando no hay dependencia (incorrelación ) de Y(-1) de las
Ui´s los estimadores conservan las dos propiedades. En este sentido se indica que cuando
no hay correlación entre ellas se dice que existe independencia, en tanto que cuando se
detecta que existe, se dice que existe una dependencia total.
Uso del Contraste h de Durbin
Así como se hizo con la d de Durbin Watson, el contraste h de Durbin establece las
mismas hipótesis:
Ho: ρ=0, no hay correlación de Y(-1) con las Ui´s
Ha: ρ≥0 ó ρ≤0 , decimos que hay correlación positiva o negativa entre ellas.
Nota: Eviews no contiene solo el símbolo “mayor que” ni “menor que”, por eso tuve que
usar el que nos proporciona, es decir, el de “mayor o igual que” y el de “menor o igual
que”.
La fórmula para calcular manualmente es h=  *la raíz cuadrada del cociente de T/1-TS2
βk+1
con N(0,1). Así, . se establece que h se distribuye normalmente con media aritmética
cero y varianza 1; donde ρ es el estimador obtenido en la regresión que se corre de las Ui
frente así mismas retardadas un periodo y sin término constante; TS2
βk+1
es el valor de la
varianza del estimador correspondiente a la variable endógena retardada un periodo Y(-1) y
finalmente T: es el número de términos ( Carrascal et al, 2001: 296). Aquí es importante
observar que el signo de la estadística h en la Ha es igual al de ρ. Ejemplo: con α=5%
trabajada en una prueba de una cola o extremo, cuando h es mayor que Zα=
+
1.645 se
rechaza Ho de incorrelación y se acepta Ha de que existe autocorrelación positiva entre Y(1) y las Ui´s; también cuando h es menor que Zα
= -
1.645 se rechaza Ho frente a la
aceptación de Ha de que se ha detectado autocorrelación negariva.
Así, para detectar con Eviews si hay autocorrelación los pasos a seguir son los siguientes:
1. Crear la ecuación: Quick/Estimate Ecuation/ Y_C_X1_Y(-1) / ok. Cuyos resultados son
los siguientes:
Dependent Variable: Y
Method: Least Squares
Date: 10/28/08 Time: 12:25
Sample(adjusted): 2 30
Included observations: 29 after adjusting endpoints
Variable
Coefficien Std. Error
t-Statistic
Prob.
t
C
1.424546 0.460451
3.093805
0.0047
X1
0.161815 0.088443
1.829606
0.0788
Y(-1)
0.715366 0.119971
5.962817
0.0000
R-squared
0.956057
Mean dependent var 11.38966
Adjusted R-squared 0.952677
S.D. dependent var
S.E. of regression
0.830570
Akaike info criterion 2.564289
Sum squared resid
17.93603
Schwarz criterion
2.705734
Log likelihood
-34.18219
F-statistic
282.8386
Prob(F-statistic)
0.000000
Durbin-Watson stat 2.148425
3.818035
Observe que estos resultados son para 29 datos porque hay un retardo o rezago, por eso
leemos en “Sample (adjusted): 2 30”
y en “included observatios: 29 after adjusting
endpoints”.
2. Crear la variable de los residuos (Ui) mediante: Procs/make residual series/ y en la
ventana que se abre aceptamos “Residual Type”: o “Ordinary” / ok y aparecen las Ui con el
nombre de “Resid01”.
3. Realizar la ecuación de las Ui creadas con respecto a ellas mismas rezagadas un periodo:
Quick/Estimate Ecuation/ resid01 resid01(-1)/ ok y aparece el siguiente Cuadro:
Dependent Variable: RESID01
Method: Least Squares
Date: 10/28/08 Time: 12:33
Sample(adjusted): 3 30
Included observations: 28 after adjusting endpoints
Variable
Coefficien Std. Error
t-Statistic
Prob.
t
RESID01(-1)
-0.182654 0.169592
R-squared
0.032551
-1.077024 0.2910
Mean dependent var 0.067653
Adjusted R-squared 0.032551
S.D. dependent var
0.725708
S.E. of regression
0.713799
Akaike info criterion 2.198629
Sum squared resid
13.75673
Schwarz criterion
2.246208
Log likelihood
-29.78081
Durbin-Watson stat
1.781797
En este caso el dato importante, y por tanto el que vamos a rescatar, es el valor del
coeficiente de la variable retardada “Resid01(-1)” que identificamos con la letra “ρ” (rho) y
que en Eviews representamos con “r” que es igual a: -0.182654, mismo que en EViews se
guarda como objeto escalar de la siguiente forma: vamos al menú de comandos de la
ventana principal y ahí escribimos: scalar_r=@coefs(1)/enter y primero aparece como un
objeto más en el Workfile mismo que si le damos doble click su valor aparecerá en la parte
inferior izquierda de la pantalla como se muestra a continuación:
4. Se calcula la “h de Durbin” escribiendo en la ventana de comandos lo siguiente:
Scalar_h=r*@sqrt(@regobs/(1-@regobs*(@stderrs(3))^2))
Nota: Para calcular “h” necesitamos que esté activada la ecuación original, aquella en
donde está incluida la variable endógena retardada como exógena, esto se logra dando un
click sobre ella.
Donde:
r = Coeficiente de las Ui rezagadas un periodo.
Regobs = Número de observaciones, en este caso 30.
Stderrs(3) = Es la desviación estándar del estimador correspondiente a la variable endógena
retardada Y(-1). El número 3 del stderrs corresponde a la posición de este coeficiente en la
ventana de la ecuación de regresión en Eviews, por lo que puede variar según su posición o
lugar que ocupe en dicha ventana: en nuestro caso ello sucedió cuando creamos en el paso 1
la ecuación de regresión en que establecimos Y(-1) en tercer lugar, por ello su stderrs ahora
lleva el número 3. ; al respecto, dicha posición o lugar la establece subjetivamente la
persona que está calculando h . En este contexto el 2 que le sigue en la ecuación anterior
de arriba para h, significa que stderrs fue elevado al cuadrado, i.e., indica que es la
varianza de Y(-1).
Cabe señalar que para elevar al cuadrado en Eviews hacemos:
apretamos la tecla Alt simultáneamente con las teclas 9 y 4, enseguida se sueltan las tres y
aparece en pantalla “^2”.
Así, en el ángulo inferior izquierdo aparece la leyenda “h successfully created”, para poder
ver su valor damos doble click en el objeto escalar del Workfile que denominamos “h”.
Interpretación de “h de Durbin”: Su valor de -1.28867631565 se compara con los
valores que toma Zα en una distribución normal que tenga media cero y varianza unitaria,
cuando α= 5% en una prueba de una cola o extremo, tal que en ese punto Zα = ±1.645,
valores que contrastamos con h = - 1.288676, de manera que rechazamos Ho de ausencia de
autocorrelación si el valor de h es mayor que los valores de la distribución en Zα = ±1.645
al 95% de confianza. Así, como h está en la zona de aceptación, aceptamos Ho y decimos
que no hay autocorrelación entre Y(-1) y los residuos Ui.
Atención: Si hubiéramos rechazado Ho, es decir aceptado Ha, estaríamos frente a un
problema de autocorrelación, mismo que deberíamos de resolver llevando a cabo la
estimación incorporando un esquema AR(1) y partiendo de la estimación por variables
instrumentales para ver si es total la dependencia de Y(-1) de las Ui´s. Con esta
metodología obtendriamos estimadores consistentes de todos los parámetros incluido el del
esquema AR(1).
Así, suponiendo que hubiera autocorrelación entre Y(-1) y Ui´s,
ilustremos cómo se eliminaría con el siguiente ejemplo:
III.2.- Eliminación de la autocorrelación con el método de variables instrumentales.
En este caso debe cuidarse que el número de variables instrumentales debe ser menor o
igual que el número de regresores en el modelo econométrico ( el programa Eviews
incluye por default una variables con valor de 1 cuando no se haya incluido C entre las
mismas), por eso utilizamos X1 y X1(-1).
1. Creamos la ecuación con los instrumentos X1 y X1(-1) de la siguiente manera:
Quick/Estimate Equation/ y en la especificación del modelo escribimos: Y_X1_Y(-1)_C /,
abajo en el método seleccionamos: TSLS-Two stage Least Squares (TSNLS and ARMA),
luego en “Instrument List” escribimos: X1_X1(-1)/ok y aparece la siguiente ecuación:
Dependent Variable: Y
Method: Two-Stage Least Squares
Date: 10/28/08 Time: 13:14
Sample(adjusted): 2 30
Included observations: 29 after adjusting endpoints
Instrument list: X1 X1(-1)
Variable
Coefficien Std. Error
t-Statistic
Prob.
t
X1
0.209346 0.136012
1.539176
0.1358
Y(-1)
0.647204 0.190603
3.395554
0.0022
C
1.546159 0.532832
2.901779
0.0075
R-squared
0.955512
Mean dependent var 11.38966
Adjusted R-squared 0.952089
S.D. dependent var
3.818035
S.E. of regression
0.835710
Sum squared resid
18.15871
F-statistic
267.5755
Durbin-Watson stat
2.044055
Prob(F-statistic)
0.000000
El método arriba sombreado se traduce al español como “mínimos cuadrados en dos
etapas” , por ejecutar el caso especial de lo que estamos llamando “ variables
instrumentales”; al hacerlo, obtiene los instrumentos porque obtiene en una primera etapa
las regresiones por MCO de cada uno de los regresores de la ecuación lineal: X 1 e X1(-1) y
luego, en una segunda etapa, señala Carrascal et al (2001:300) “efectúa la estimación por
mínimos cuadrados ordinarios de la variable endógena original (Y) utilizando como
variables explicativas los valores estimados de cada una de las regresiones de la primera
etapa. Se demuestra
que estas dos etapas son equivalentes a la obtención de los
estimadores por variables instrumentales cuando se utilizan como instrumentos los valores
estimados de las regresiones de la primera etapa”.
Al respecto, en el Cuadro anterior se muestra sombreados el método y las variables
instrumentales utilizadas para hacer la regresión lineal. Aquí conviene precisar y aclarar
que las estadísticas se calcularon con las Ui´s provenientes de las variables instrumentales
y de las variables originales del modelo econométrico y, por consiguiente, no con las
variables obtenidas en la segunda etapa del algoritmo de cálculo. Sánchez, et al (2015).
De esa manera se elimina la autocorrelación, lo cual se corrobora enseguida con los dos
procedimientos que se describen a continuación en los siguientes incisos a) y b):
a).- Utilizando el correlograma, la estadística Q y la prueba Breusch – Godfrey para
corroborar lo anterior. Para la primera: View/Residual Test/ Correlogram Q-satats y
aparece:
Interpretación: Grafica y numéricamente vemos que los coeficientes de correlación no se
salen de las bandas de confianza y que en AC como en PAC los valores de  son bajos, que
indica que no existe un problema serio de autocorrelación; igualmente vemos que la
probabilidad de Q en todos los casos es mayor que 0.05 o 5% lo cual indica que no hay
autocorrelación serial entre Y(-1) y las Ui.
b).- Con la prueba de Breusch-Godfrey: View/Residual Tests/Serial Correlation LM
Test/ok y aparece:
Breusch-Godfrey Serial Correlation LM Test:
Obs*R-squared
0.611607
Test Equation:
Dependent Variable: RESID
Probability
0.434183
Method: Two-Stage Least Squares
Date: 10/28/08 Time: 13:27
Presample missing value lagged residuals set to zero.
Variable
Coefficien Std. Error
t-Statistic
Prob.
0.7608
t
X1
0.046525 0.151170
0.307767
Y(-1)
-0.062056 0.210086
-0.295386 0.7701
C
0.064875 0.544842
0.119071
RESID(-1)
-0.161584 0.220172
-0.733898 0.4698
R-squared
0.021090
0.9062
Mean dependent var -2.68E17
Adjusted R-squared -0.096379
S.D. dependent var
S.E. of regression
0.843226
Akaike info criterion 2.624278
Sum squared resid
17.77574
Schwarz criterion
2.812871
Log likelihood
-34.05203
F-statistic
0.179536
Prob(F-statistic)
0.909269
Durbin-Watson stat 1.709575
0.805311
Interpretación: Observamos que p- valores: probabilidad para la Chi cuadrada “Obs*Rsquared” es 0.434183 que es mayor que α = 5% e indica que no hay autocorrelación .
Iguamente, la conclusión anterior también se alcanza al analizar la p-probabilidad del
Coeficiente AR(1): RESID(-1) estimado que no es significativo porque su p: probabilidad
de 0.4698 ≥ α=5%, lo que confirma la estructura AR(1) para los residuos, de manera que
podemos decir que los errores muestran un esquema autorregresivo de orden 1 dada que la
no significación estadística de RESID(-1) es 0.4698. Similarmente, dado que R2 =0.021090
es un valor muy bajo, cercano a cero, ello también indica que hay incorrelación.
IV.-Cálculo del efecto en el corto y largo plazo
Por otra parte, con base en lo anterior, hablando del efecto en el tiempo de la variable
independiente sobre la dependiente, decimos que el modelo arriba estimado con el método
de mínimos cuadrados en dos etapas, proporciona los elementos para señalar con los
coeficientes de X1 y de Y(-1) lo siguiente:
1.- Que el Ingreso(X1) tiene un efecto a corto plazo sobre el consumo de 0.209346 y
2.- Que en el largo plazo es de 0.59339= 0.209346/1-0.647204=0.59339.
Lo anterior se interpreta así: Cuando el ingreso aumenta en una unidad en el periodo, el
consumo crece en 0.209346 en el corto plazo. Esa unidad adicional en el ingreso produce
efectos sobre el consumo de los siguientes periodos, tal que en el largo plazo su incidencia
será de 0.59339 unidades.
La cuantificación del efecto a largo plazo tuvo como referencia la consideración de que los
modelos autorregresivos se pueden ver como modelos con “ infinitos retardos de la variable
explicativa.”, que, como se observa en el modelo, su cálculo de 0.59339 provino de “ la
suma de los infinitos retardos que pueden calcularse como la suma de los infinitos términos
de una progresión geométrica de razón 0.647204 y primer elemento 0.209346”
(
Carrascal et al, 2001: 305 y 318).
Conclusiones
1.- Por medio del modelo de retardos distribuidos: finitos vimos que el efecto prolongado
de X1 sobre Y es de cuatro años.
2.- Por medio del modelo de retardos distribuidos infinitos vimos que el Ingreso(X1) tiene
un efecto a corto plazo sobre el consumo de 0.209346 y que en el largo plazo es de
0.59339= 0.209346/1-0.647204=0.59339.
3.- Con el método de mínimos cuadrados en dos etapas y usando variables instrumentales
se corrigió la autocorrelación.
BIBLIOGRAFIA
1.- Carrascal, Urcilino, González . Yolanda y Rodríguez, Beatriz, (2001), Análisis
Econométrico con Eviews, Alfaomega,Ra-Ma, Madrid, España.
2.-Pérez, López, César, ( 2007), Econometría Básica, Técnicas y Herramientas, Pearson,
Prentice Hall, Madrid, España.
3.- Sánchez, Barajas, Genaro, Bustamante, Lemus, Carlos, (2015), Econometría Básica,
con NTIC y Eviews, Facultad de Economía, UNAM, México, Distrito Federal.