Download Econometria de Datos en Paneles

Document related concepts
no text concepts found
Transcript
¿Porque paneles?
Modelos lineales para datos en paneles
Econometria de Datos en Paneles
Walter Sosa-Escudero
Universidad de San Andres
Agosto de 2011
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
¿Porque paneles?
Ejemplo (Cronwell y Trumbull): Determinantes del crimen
y = g(I), y = crimen, I = variables de justicia criminal.
Corte transversal: (yi , Ii ) para varias regiones i = 1, . . . , n
I resulta ‘muy importante’
Critica: I capta el efecto de otros efectos regionales, que
tambien son determinantes del crimen.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
En terminos econometricos
Existe una variable omitida y relacionada positivamente con I.
El estimador de MCO que regresa y en I es sesgado (hacia
arriba)
Solucion? ‘Controlar’ por esta varaible omitida.
Paneles al rescate: una solucion simple sin tener que incorporar
nuevas variables
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Datos en paneles
Una base de datos en panel contiene informacion para varios
individuos (empresas, paises, etc.) en el tiempo.
El aspecto fundamental es esta bidimensionalidad de los datos.
Ejemplos: PSID: 6500 familias desde 1968.
La EPH tiene una estructura de panel rotativo.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Ventajas
Control de ‘heterogeneidades no observables’
Con N individuos y T periodos podriamos estimar N modelos
de series de tiempo y T modelos de corte transversal.
Las ventajas de disponer de un panel tienen que ver con la
posibilidad de agregar esta informacin de alguna manera.
Ejemplo: yit = x0it β + uit
Supone que el modelo lineal subyacente es el mismo para
todos los individuos y periodos.
Mayor informacion sobre un mismo parametro. Mayor
eficiencia.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Desventajas
No siempre es posible agregar informacion temporal y de corte
transversal (pueden ser ms observaciones pero de poblaciones
heterogeneas).
Los paneles son costosos de implementar y administrar.
Problemas de selectividad: auto-seleccion, no respuesta,
”attrition”.
Dimension temporal corta
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
El Modelo
El modelo basico es:
yit = x0it β + uit
uit = µi + δt + it
i = 1, . . . , N, t = 1, . . . , T . xit es un vector de K variables
explicativas, incluyendo una constante.
El termino de error incluye tres componentes, que representan
las tres posibles fuentes de variabilidad no observable.
Supondremos δt = 0 y que it satisface todos los supuestos
clasicos.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Caso mas simple: µi = 0
En este caso, uit = it satisface todos los supuestos del teorema de
Gauss-Markov:
E(it ) = 0
2
σ si i = h y t = s
E(it ehs ) =
0 si i 6= h o t 6= s
El estimador de MCO es MELI. La estructura de panel no agrega
informacion
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
En terminos matriciales
Y = Xβ + u
YN T ×1 , XN T +×K , apilando las observaciones por individuo,
primero ordenadas temporalmente.
Entonces:
β̂M CO = (X 0 X)−1 X 0 Y
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
El estimador de efectos fijos
yit = x0it β + µi + it
Las realizaciones de µi pueden ser estimadas con un panel (no con
un corte transversal!).
Puede ser visto un modelo lineal en donde cada individuo tiene su
propia ordenada al origen:
yit = µi + β1 +β2 x2,it + · · · + βK xK,it + it
| {z }
El modelo se puede estimar usando N − 1 variables binarias por
individuo, para evitar la ‘trampa de variables binarias’.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
En terminos matriciales
Y = Xβ + Dµ + u
Y es N T × 1, X es N T × K, X incluye el intercepto.
D es una matriz de N − 1 variables binarias por individuo.

1N


≡

1
1
..
.
1



,


1N
0
···


Z=


0
..
.
1N
0
..
.
0
0
···
Walter Sosa-Escudero
0
..
.
..
.
1N






N T ×(N −1)T
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Reescribamos el modelo como:
Y = Xβ + Dµ + u = Ẋδ + u
con Ẋ ≡ [X D] y δ ≡ [β 0 µ0 ]0 .
Entonces, el estimador de efectos fijos es:
β̂EF
δ̂EF =
= (Ẋ 0 Ẋ)−1 Ẋ 0 Y
µ̂EF
que no es otra cosa que un estimador de MCO agregando N − 1
variables binarias por individuo.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Efectos fijos y transformacion ‘within’
Comencemos con el modelo
yit = x0it β + µi + it
Tomando promedios por individuo:
ȳi = x̄0i β + µi + ¯i
Restando
yit − ȳi = (xit − xi )0 β + it − ¯i
o
∗
yit
= xit ∗0 β + ∗it
con m∗it ≡ mit − m̄i , m = y, x, .
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Resultado:
β̂EF = (X ∗0 X ∗ )−1 X ∗0 Y ∗
(Prueba: Teorema de Frisch,Waugh, Lovell)
Existen dos formas identicas de computar β̂EF .
Regresar Y en X y las variables binarias por individuo. β̂EF son los
coeficientes estimados para X.
En dos pasos: 1) Expresar las variables en desvios con respecto a la
media por individuo. 2) MCO en base a estos desvios.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Terminologia:
Modelo within
yit − ȳi = (xit − xi )0 β + it − ¯i
Modelo between
ȳi = x̄0i β + µi + ¯i
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Propiedades de β̂EF
Es insesgado (X y Dµ son exogenas con respecto a ).
Es consistente, cuando N o T → ∞.
Importante: la insesgadez y consistencia de β̂EF no presupone
que X y Dµ son ortogonales (puede haber correlacion entre
X y Dµ
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Efectos fijos y control de heterogeneidades no observables
Supongamos que el modelo es
yit = x0it β + zi0 δ + µi + it
zi no es observable, pero esta correlacionada con xit .
La transformacion within de este modelo es
∗
yit
= xit ∗0 β + ∗it
La tranformacion within elimina cualquier variable que no varia en
el tiempo (zi y µi ): estimar por efectos fijos permite ‘controlar’
por la presencia de zi .
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Es relevante notar que sin datos de panel, no podriamos haber
dado cuenta de zi (que no sea incluyendola en el nodelo.
Con datos de corte transversal el modelo es
yi = x0i β + zi0 δ + µi + i ,
de modoe que omitir zi conduce a sesgos. Observar que la
tranformacion within es inaplicable (trivialmente cero).
Este es el sentido en el cual la disponibilidad de paneles permite
controlar por variables omitidas que no varian en el tiempo.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Una exploracion grafica
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Verbalizacion
Y = tasa de criminalidad
X = ineficiencia del sistema judicial (mas ineficiente, mas
criminalidad).
Dos regiones
Determinante omitido del crimen, a que varia solo por region
y correlacionado (positivamete) con la ineficiencia judicial:
densidad poblacional.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
El estimador de efectos aleatorios
El modelo es el mismo
yit = x0it β + µi + it
En terminos matriciales
Y = Xβ + Dµ + Si Dµ es ortogonal a X, y si E(µi |X) = 0, entonces, el estimador
de MCO que regresa Y en X es insesgado.
Es decir, si Dµ es ortogonal a X, la omision de las variables
binarias no sesga al estimador de MCO.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Efectos fijos vs aleatorios
Discusion muy extraña. Es mas una cuestion de tratamiento
Y = Xβ + Dµ + Efectos fijos (controla por Dµ)
Y = Xβ + Dµ + Efectos aleatorios (trata a Dµ como variable omitida)
Y = Xβ + Dµ + Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Y = Xβ + Dµ + Y = Xβ + u,
u ≡ Dµ + Problema: u no satisface los supuestos clasicos, aun cuando Dµ y
por separado lo hagan.
Prueba simple: supuestos clasicos por separado (esperanza nula,
no correlacion ni heterocedasticidad), ademas, no correlacion entre
Dµ y . Entonces
V (u) = V (Dµ + )
= DV (µ)D0 + V ()
= σµ2 + σ2 IN T
que no es un escalar por la matriz identidad (los elementos fuera
de la diagonal no son cero).
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Intuicion: uit = µi + it
Trivialmente, uit esta correlacionado con ui,t−1 ya que ambos
‘comparten’ µi : la presencia permanente de µi hace que la
especificacion de efectos aleatorios induzca autocorrelacion.
Si bien MCO es insesgado, no es eficiente, por la presencia de
autocorrelacion.
Eficiente? Minimos cuadrados generalizados.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
MCG para efectos aleatorios
Consideremos un modelo lineal basico:
Y = X 0β + u
en donde valen todos los supuestos clasicos, salvo que:
V (u) = Ω
Ω es una matriz simetrica y positiva definida (permite,
potencialmente, autocorrelacion y heterocedasticidad).
Teorema (Aitken): el MELI de β es:
β̂M CG = (X 0 Ω−1 X)−1 X 0 Ω−1 Y
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
En nuestro caso
V (u) = σµ2 DD0 + σ2 IN T ≡ Ω(θ)
con θ0 = (σµ2 , σ2 )0
La implementacion de MCG requiere primero estimar θ (los
componentes de varianzas).
Estimador de efectos aleatorios: estimador MCG.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Resumen
Y = Xβ + Dµ + X ⊥ Dµ: MCO, EF, EA y between son todos consistentes
parar β. EA es eficiente.
X ¬⊥ Dµ: solo EF es consistente para β.
La practica gravita mayoritariamente a EF.
Walter Sosa-Escudero
Econometria de Datos en Paneles
¿Porque paneles?
Modelos lineales para datos en paneles
Test de Hausman
H0 : X ⊥ Dµ, HA : X ¬⊥ Dµ
Test de Hausman: bajo H0
H = (β̂EA − β̂EF )0 (ΩEF − ΩEA )−1 (β̂EA − β̂EF ) ∼ χ2 (K)
Rechazar si H es significativamente distinto de cero.
Intuicion: bajo H0 , β̂EA y β̂EF son consistentes, H deberia
ser pequeño. Bajo HA , solo β̂EF es consistente, H deberia
ser alto.
Permitiria, bajo H0 , explotar las ganancias de eficiencia de
estimar por EA.
Walter Sosa-Escudero
Econometria de Datos en Paneles