Download Modelos dinámicos de datos de panel(2).

Document related concepts
no text concepts found
Transcript
Modelos dinámicos de datos de
panel(2).
Siga
J.Muro(8/12/2003)
1
Otros temas relevantes del enfoque
de datos de panel.
• Lo que trataremos:
1. Modelos no lineales para datos de panel.
2. Seudopaneles y paneles rotatorios.
• Lo que no trataremos:
1. Atrición.
Siga
J.Muro(8/12/2003)
2
Modelos no lineales de datos de panel.
• Introducción.
• Enfoques:
• Planteamiento clásico.
• Modelos dinámicos.
Siga
J.Muro(8/12/2003)
3
Introducción.
Y *it = Xitβ +ηi +ν it ,i = 1,2,..,N;t = 1,2,..,T.
• Y* es una variable índice o latente.
• Y es la variable observada. Regla de observación:
• Y = 1{Y*>0}. Modelos logit, probit.
• Y = max (Y*,0). Modelo tobit (tipo I).
• Y = 1{Y*2>0}*Y*. Modelo heckit (tobit tipo II).
• Queda mucho por hacer (cuerpo general).
• ¿Efectos fijos o aleatorios?
• Siga.
J.Muro(8/12/2003)
4
Introducción.
Y *it = Xitβ +ηi +ν it ,i = 1,2,..,N;t = 1,2,..,T.
• Problema: aunque X sea estrictamente exógena
(supuesto aún habitual), la no observación de Y*
hace que β no esté identificada (sin restricciones
adicionales).
• Transformaciones que eliminan efectos fijos
dependen del carácter aditivo o multiplicativo de
dichos efectos.
• ¿Por qué no utilizar el modelo lineal de
probabilidad?
J.Muro(8/12/2003)
• Siga.
5
¿Modelo lineal de probabilidad?
• No es conveniente (aunque no se excluye) por las
razones habituales:
• Predicciones no acotadas en 0-1.
• Heteroscedasticidad.
• Comportamiento regular de los efectos individuales,
− X 'it β ≤ ηi ≤ 1 − X 'it β , t = 1,2,...,T .
Atrás
J.Muro(8/12/2003)
6
Introducción.
• Máxima verosimilitud frente a máxima
verosimilitud parcial.
• Máxima verosimilitud condicional.
• Atrás
J.Muro(8/12/2003)
7
Planteamiento clásico de modelos no
lineales.
• Modelos dicotómicos.
• Modelo de variable dependiente censurada.
• Modelo de variable dependiente con
selección muestral.
Atrás
J.Muro(8/12/2003)
8
Modelos dicotómicos.
• ¿Efectos fijos o aleatorios?
• Depende de posibilidades teóricas: máxima
verosimilitud condicional u otras.
• Depende de posibilidades de cálculo.
• Modelos para efectos fijos.
• modelo logit. (probit intratable por ahora).
• enfoque semiparamétrico, Manski (1987).
• Modelos para efectos aleatorios
• modelo probit.
Atrás
J.Muro(8/12/2003)
9
Modelo logit.
y *it = X'it β +ηi +ν it .
• Regla de observación, en presencia de efectos fijos:
Prob[ yit = 1] = Prob[ y *it > 0] =
= Prob[ν it > − X 'it β − ηi ] = G( X 'it β + ηi ).
• G(.) es una función de distribución simétrica.
• Problema de parámetros incidentales, Neyman y Scott
(1948), Lancaster (2000).
• Chamberlain (1980) demuestra que el problema no se
elimina con las transformaciones usadas en modelos con
Siga
variables continuas (dif.; fe; ortog.).
J.Muro(8/12/2003)
10
Modelo logit.
• Estimación.
• Chamberlain (1980), máxima verosimilitud
condicional.
Atrás
J.Muro(8/12/2003)
11
Modelo logit. Chamberlain (1980).
• El problema de los parámetros incidentales se resuelve
mediante un estadístico suficiente mínimo para ηi.
• Maximización de verosimilitud condicional.
T


Lc = ∏ Pr ob  yi1....... yiT | ∑ yit ,


i =1
i =1
N
• Como se ve la verosimilitud es condicional a un estadístico
suficiente para los efectos fijos.
• Equivale matemáticamente al estimador de un logit
condicional.
• Ejemplo.
Atrás
• Contraste.
• Estudios empíricos. J.Muro(8/12/2003)
12
Aclaración
• Un estadístico suficiente es una función de
los datos de tal forma que la distribución de
los datos condicional al estadístico no
depende de los parámetros representativos
de la heterogeneidad individual. Pero al
condicionar podemos no eliminar los
parámetros de interés.
• Atrás.
J.Muro(8/12/2003)
13
Supongamos T = 2, fijo.
La suma que condiciona la expresión de la función de
verosimilitud, sólo puede tomar los valores siguientes: 0,
1, 2.
Las únicas informativas son aquellas para las que la
suma condicionante toma el valor 1.
La expresión general de un modelo logit es,
exp ( X ' it β + η i )
.
Prob [ y it = 1 ] =
1 + exp ( X ' it β + η i )
Y la contribución informativa de las observaciones de
nuestra muestra es,
J.Muro(8/12/2003)
14
Prob[ yi1 = 1, yi 2 = 0 | yi1 + yi 2 = 1] =
1
1 + exp(( Xi 2 − Xi1 )' β )
.
exp(( X i 2 − X i1 )' β )
.
Prob[ yi1 = 0, yi 2 = 1 | yi1 + yi 2 = 1] =
1 + exp(( X i 2 − X i1 )' β )
Como se ve se han eliminado los efectos individuales.
Cabe usar un programa estándar de estimación de un
logit sin más que utilizar la diferencia entre los valores
observados en ambas olas como regresor. En el lado
izquierdo se incluyen los valores de la variable
dependiente como 1 cuando el individuo transita del 0 al
1 y 0 cuando el individuo transita del 1 al 0.
Atrás
J.Muro(8/12/2003)
15
Contraste.
• Contraste del tipo Hausman.
• Estimador del logit del panel completo es
consistente y eficiente si no hay efectos
individuales (H0). Si los hay (H1) es inconsistente.
• Estimador condicional de Chamberlain (logit
efectos fijos) es consistente bajo ambas hipótesis,
e ineficiente bajo la nula.
Atrás
J.Muro(8/12/2003)
16
Estudios empíricos.
• Björklund (1985): relación entre desempleo
y problemas de salud mental.
• Winkelman y Winkelman (1998): relación
entre desempleo y satisfacción de los
individuos.
Atrás
J.Muro(8/12/2003)
17
Modelo probit.
• Aunque hasta ahora resulta inabordable en presencia de
efectos fijos proporciona buenos resultados para paneles
con efectos aleatorios.
• La estimación maximoverosímil proporciona estimadores
consistentes.
• Plantea problemas de cálculo elevados. Butler y Moffit
(1982): procedimiento de cuadratura Gaussiana (ej. Stata).
• Supuestos implícitos:
• no correlación entre variables del lado derecho y componentes
específicos del término de error del modelo.
• Contrastes:
• Avery, Hansen y Hotz (1983) introducen un contraste de
exogeneidad.
• Alternativas de estimación.
J.Muro(8/12/2003)
18
Modelo probit (estimación).
• No hay correlación: Avery, Hansen y Hotz (1983)
una estimación del modelo mediante el método
generalizado de momentos (MGM).
• Hay correlación: añadir nuevos supuestos de
identificación.
• estimador de mínima distancia de Chamberlain (1984).
• estimador intra en dos etapas de Bover y Arellano (1997), que
es consistente y asintóticamente normal para T fijo y que
admite entre las variables del lado derecho retardos de la
variable del lado izquierdo, variables exógenas y términos de
heterogeneidad individual inobservada.
Atrás
J.Muro(8/12/2003)
19
Estimador de Manski (1987).
• Estimación consistente de un modelo no lineal de datos de
panel con efectos individuales (no se puede aplicar MV
condicional).
• Idea básica: estimador de modelo dicotómico de Manski
(1975).
• Intuición: bajo estacionariedad de uit la generalización del
logit dicotómico que conduce al logit de efectos fijos se
producirá igual entre el estimador semiparamétrico de
Manski y el nuevo estimador de Manski para datos de
panel con efectos fijos.
• Método.
• Propiedades: consistente, no converge a raíz cuadrada de
N; no es asintóticamente normal. Admite correlación y
Atrás
heteroscedasticidad transversal. No admite efectos
temporales (v. ficticias temporales).
J.Muro(8/12/2003)
20
Estimador de Manski (1975).
• Estimador de tanteo (puntuación) máximo
(maximum score): proporciona una
estimación consistente de los parámetros de
un modelo dicotómico, salvo un factor de
escala.
• Método semiparamétrico ( de ajuste).
• Idea.
• Función a maximizar.
Atrás
J.Muro(8/12/2003)
21
y i = 1{X ' i β + u i ≥ 0}.
P ( y i = 1 | X i ) = P ( u i | X ≥ − X ' i β ).
Si la mediana de la distribución de u condicionada a X
es cero, las observaciones para las que X’iβ sea positivo
tendrán probabilidades superiores a ½, mientras que
las que tienen el valor del índice negativo tendrán
probabilidades inferiores a ½.
Lo anterior se puede expresar como,
signo [P ( y i = 1 | X i ) − P ( y i = 0 | X i ) ] = signo ( X ' i β ).
Si queremos maximizar el tanteo, los aciertos, habrá
que maximizar el número de veces en que coincide el
signo de la predicción (X’ib) con el signo de (2yi- 1).
Atrás
J.Muro(8/12/2003)
22
1
N
N
∑ {[2 y
i
− 1 − (1 − 2α ) ] signo ( X ' i β )}.
i =1
El estimador resultante es consistente pero no converge a la tasa
habitual de la raíz cuadrada de N. Su distribución asintótica no
es normal.
Atrás
J.Muro(8/12/2003)
23
Para T=2
P ( y i 2 = 1 | x i 1 , x i 2 , y i 1 + y i 2 = 1) ≤ 1 / 2
>
Si
( x i 2 − x i1 )β ≤ 0.
>
La función a maximizar es
1
N
N
∑ signo ( y
i2
− y i 1 ) signo (( x i 2 − x i 1 ) β ).
i =1
Si T>2, la función a maximizar se construye mediante la
comparación de todas las parejas de observaciones posibles.
J.Muro(8/12/2003)
Atrás
24
Modelos de variable censurada.
• Efectos fijos.
• Efectos aleatorios.
Atrás
J.Muro(8/12/2003)
25
Modelos de variable censurada
(efectos fijos).
• Heckman y MaCurdy (1980): oferta de
trabajo femenina a lo largo del ciclo vital.
• Modelos semiparamétricos:
• Honoré (1992).
• Honoré y Kyriazidou (2000a).
Atrás
J.Muro(8/12/2003)
26
Heckman-MaCurdy(1980).
• Modelo:
Y it * = X it β + η i + ν it ,
Y it = max( Y it *, 0 ).
i = 1,2,.., N; t = 1,2,.., T.
• Las transformaciones de modelos lineales no
eliminan los efectos fijos (por la parte no lineal de
la variable dependiente). Aparece nuevamente el
problema de los parámetros incidentales.
• Procedimiento de estimación: máxima verosimilitud
iterativa.
Atrás
J.Muro(8/12/2003)
27
Honoré(1992).
Y it * = X it β + η i + ν it ,Yit = max( Y it *, 0 ).
i = 1,2,.., N; t = 1,2,.., T.
• Intuición: Si censuramos artificialmente la variable
dependiente se podrán eliminar los efectos individuales
mediante diferencia (Powell (1986)).
• Estimador arreglado o aparejado que minimiza la suma
de los errores absolutos (trimmed LAD) o que minimiza
la suma de los errores al cuadrado (trimmed LS).
• νit|Xit,ηi es iid~N(0,σν2).
• La distribución de la variable latente es simétrica y esta
simetría se transmite a la distribución de los valores
observados (para los verdaderos valores de los
Siga
parámetros).
J.Muro(8/12/2003)
28
Veamos lo anterior desde el punto de vista de los residuos
eist (b) = max{yis , ( xis − xit )b}− max{0, ( xis − xit )b}.
Para b = β se cumple
eist (β ) = max{yis , ( xis − xit )β }− max{0, ( xis − xit )β } =
= max{ηi +ν is ,− xisβ ,− xit β }− max{− xisβ ,− xit β }.
Expresión que es simétrica en s y t.
Atrás
J.Muro(8/12/2003)
29
Honoré(1992).
• El estimador MGM (con restricciones de
ortogonalidad que nacen del supuesto del
párrafo anterior) es consistente y con
distribución asintótica normal.
• Los resultados para muestras pequeñas son
razonables a partir de N≥200.
Atrás
J.Muro(8/12/2003)
30
Si suponemos νit, νit iid condicionado a xi, ηi, para T=2, la
función a minimizar es
N
∑(max{y
}− max{yi 2 ,−∆xi b}− ∆xi b)
i1 , ∆xi b
2
+
i =1
+ 2*1{yi1 < ∆xi b}(∆xi b − yi1 ) yi 2 +
+ 2*1{yi 2 < −∆xi b}(−∆xi b − yi 2 ) yi1 .
Para T>2 se tienen en cuenta todas las parejas posibles.
Atrás
J.Muro(8/12/2003)
31
Kyriazidou(1997).
• Modelo semiparamétrico.
• Sugiere realizar la exploración de los puntos siguientes:
• Primero estimar la ecuación de selección por un logit de
efectos fijos o probit de efectos aleatorios.
• Segundo aplicar primeras diferencias en la ecuación de
interés a fin de eliminar los efectos fijos de las
observaciones no censuradas.
• A continuación el análisis se centra en las observaciones
para las que x’itβ1=x’isβ1. En estos individuos tomar
primeras diferencias no sólo elimina los efectos fijos sino
también la selección muestral.
• Por lo tanto el procedimiento de estimación sugerido es:
J.Muro(8/12/2003)
Atrás
32
Kyriazidou(1997).
• Dos etapas a la Heckman.
• Primero, se estima la ecuación de selección por un logit de
efectos fijos o probit de efectos aleatorios.
• Segundo, se estiman los parámetros de la ecuación de
interés mediante MCO en la ecuación en diferencias pero
dando mayor ponderación a las observaciones para las que
se cumpla la condición de simetría anterior.
• El sistema de ponderación se realiza por un procedimiento
no paramétrico (kernel) con ancho de banda (bandwidth)
que se acerca a 0 a medida que el tamaño de muestra se
incrementa.
• La estimación es muy sensible a la elección del tamaño de
ancho de banda.
Atrás
J.Muro(8/12/2003)
33
Relajación del supuesto de
exogeneidad estricta.
Y it = X it β + η i + ν it , i = 1,2,.., N; t = 1,2,..,T.
• Modelos clásicos de datos de panel: exogeneidad
estricta de los regresores.
• Modelos dinámicos de datos de panel: se relaja
el supuesto de exogeneidad estricta.
Atrás
J.Muro(8/12/2003)
34
Supuesto de exogeneidad estricta.
Y it = X it β + η i + ν it , i = 1,2,.., N; t = 1,2,..,T.
• E(Xitνis|ηi)= E(νis |Xit,ηi)=0, √ t,s.
• Sólo se cumple la restricción incondicional en el
caso de modelos de efectos aleatorios.
• No hay retroalimentación.
• Proporciona condiciones de identificación del
vector de parámetros β.
• Fuentes de persistencia: heterogeneidad
Atrás
inobservada.
J.Muro(8/12/2003)
35
E (Y it | X it ,η i ) = X it β + η i .
Una vez controlado el efecto de los regresores y de los
efectos individuales, el valor esperado de la variable de
interés sólo depende de los valores contemporáneos de
los regresores y heterogeneidad inobservada.
Ej. salarios en función de la edad.
La edad pasada no influye sobre los salarios actuales y
éstos últimos no influyen sobre la edad futura. Esto
mismo ocurre con shocks asociados con la edad. Si el
salario mínimo depende de la edad, y ésta es
estrictamente exógena, los salarios presentes no afectan
al valor futuro del shock.
Atrás
J.Muro(8/12/2003)
36
Restricciones de momentos
secuenciales.
Y it = X it β + η i + ν it , i = 1,2,.., N; t = 1,2,..,T.
• Al margen de la correlación entre X y η.
• El término de error genérico está incorrrelacionado con
los valores contemporáneos y retardados de los
regresores (pero correlacionado con los futuros).
E (ν it | X it , X it −1 ,.... X i 1 ,η i ) = 0 , t = 1,2,.., T.
• Los regresores son secuencialmente exógenos,
condicionados a los efectos individuales.
J.Muro(8/12/2003)
37
Regresores secuencialmente
exógenos.
E (Y it | X it , X it −1 ,..., X i 1 ,η i ) = X it β + η i
• Una vez que se controla por los efectos de los
regresores y de la heterogeneidad individual
inobservada, los valores pasados de los
regresores no afectan al valor esperado
contemporáneo de Y.
• Permite que haya retroalimentación.
Atrás
J.Muro(8/12/2003)
38
Introducción.
• La mera introducción de un retardo de la
variable dependiente quiebra los supuestos
que permiten la identificación en el enfoque
clásico.
• Casi todo por hacer.
• Efectos fijos: soluciones particulares.
• Efectos aleatorios: problema de las condiciones
iniciales (a través de la compleja relación entre la
variable dependiente retardada, la heterogeneidad
inobservada, los parámetros del modelo y la
distribución de los regresores). Heckman (1981) Siga
J.Muro(8/12/2003)
39
Dependencia entre estados y
heterogeneidad.
yit = 1 xitβ +δ yi,t -1 +ηi +νit ≥ 0 .
• Fuentes de persistencia: correlación serial (νit);
heterogeneidad inobservada (ηi); dependencia
entre estados (δ).
• Consecuencias importantes de cara a los efectos de
las medidas de política económica. Ej. het. mide la
selección adversa y la dependencia entre estados
(verdadera) el azar moral.
• Definiciones.
Atrás
• Modelos.
J.Muro(8/12/2003)
40
Definiciones.
• Dependencia espúrea entre estados.
• Se dice que existe cuando la experiencia de un individuo no altera sus
preferencias. Aparentemente hay una dependencia entre estados
porque bien la heterogeneidad individual inobservada, bien la
correlación entre aspectos no controlados, ocasionan un
comportamiento similar en el futuro.
• Dependencia verdadera entre estados.
• Se dice que existe cuando la experiencia de un individuo modifica sus
preferencias de forma que su comportamiento en el futuro es diferente
del de otro individuo idéntico que no haya tenido dicha experiencia.
Su medida implica controlar de manera adecuada la presencia de
heterogeneidad inobservada y correlación serial entre los residuos (y
condiciones iniciales).
• Heterogeneidad inobservada.
• Aspectos intrínsecos individuales (idiosincrasia), y permanentes en el
tiempo, que explican el comportamiento diferencial de los individuos
(con idénticas características observadas).
Atrás
J.Muro(8/12/2003)
41
Modelos.
• Lo que se presenta:
• Modelos dicotómicos.
• Lo que no se presenta:
• Modelos con variable dependiente censurada.
• Modelos con variable dependiente sometida a
selección muestral.
Atrás
J.Muro(8/12/2003)
42
Modelos dicotómicos dinámicos.
yit = 1 xitβ +δ yi,t-1 +ηi +νit ≥ 0 .
• Chamberlain (1985).
• Honoré y Kyriazidou (2000b).
Atrás
J.Muro(8/12/2003)
43
Chamberlain (1985).
yit = 1 δ yi,t -1 + ηi +ν it ≥ 0 .
• Generalización del estimador por máxima
verosimilitud condicional del logit de efectos fijos.
• Para T≥4, condicionar la verosimilitud elimina
también los efectos fijos.
• En ausencia de autocorrelación, eso permite el
contraste de la dependencia entre estados.
Atrás
J.Muro(8/12/2003)
44
Para el periodo inicial, el resultado es observado pero su
probabilidad es desconocida.
P(Yi0 = 1|ηi) = p0(ηi).
Para cualquier periodo distinto del inicial,
P(Yit = 1 | η i ,Yi 0 ,Yi1 ,..,Yi ,t −1 ) =
(
exp δYi ,t −1 + ηi
(
)
1 + exp δYi ,t −1 + ηi
)
.
En consecuencia, si se condiciona sobre la suma de las Y y sobre
los efectos individuales, la expresión elimina los efectos
individuales.
Magnac (1997) contiene resultados similares para el logit
multinomial.
Atrás
J.Muro(8/12/2003)
45
Honoré y Kyriazidou (2000b).
{
}
y it = 1 x it β + δ y i,t -1 + η i + ν it ≥ 0 .
• Generalización del estimador de Chamberlain. Incluye
variables exógenas.
• Supuesto adicional: los errores del modelo que conduce a
las condiciones iniciales (P0) son iid a lo largo del tiempo,
con distribuciones logísticas e independientes del vector
(x’i, ηi, yi0) para cualquier periodo de tiempo.
• Aún así, para eliminar los efectos individuales, el análisis
hay que restringirlo a las observaciones para las que x’i2=
x’i3, o al menos muy próximas.
J.Muro(8/12/2003)
Atrás
46
Modelos dinámicos con variable
dependiente censurada.
yit = 1 xitβ +δ yi,t-1 +ηi +νit ≥ 0 .
• Honoré (1993).
Atrás
J.Muro(8/12/2003)
47
Modelos dinámicos con selección
muestral.
yit = 1 xitβ +δ yi,t-1 +ηi +νit ≥ 0 .
• Kyriazidou (1999).
Atrás
J.Muro(8/12/2003)
48
Generalidades.
• Utilizar una transformación que elimine la
heterogeneidad individual inobservada:
máxima verosimilitud condicional.
• Ciertos procedimientos de aparejar o
arreglar las observaciones.
• Completar la estructura de modelos con
efectos aleatorios.
Atrás
J.Muro(8/12/2003)
49
Otras alternativas.
• Arellano (1993).
• Contraste robusto a heteroscedasticidad y
autocorrelación de forma desconocida.
 yi +   X i + 0  β   ui + 
 =
+  .



 y   X ' X ' γ   u 
 i   i
 i 
i
• donde
J.Muro(8/12/2003)
50
1/ 2
T −t  
1

(
)
y
y
...
y
t
=
1
,
2
,....
T
−
1
.
−
+
+
it
i
,
t
+
1
iT

T −t +1  T −t
+ 
yit = 
• El contraste se reduce al de H0: γ=0.
• Debido a la presencia de heteroscedasticidad y
autocorrelación de forma desconocida la
matriz de varianzas y covarianzas a utilizar es
la sugerida por White (1980).
J.Muro(8/12/2003)
51
Seudopaneles y paneles rotatorios.
• Seudopaneles. Combinación de varios
cortes transversales representativos e
independientes, que corresponden a
periodos diferentes.
• Paneles rotatorios. Sustitución de un
porcentaje de la muestra por nuevos
entrevistados después de un número de
periodos de permanencia. Comprenden
características comunes a los seudopaneles
y a los paneles.
J.Muro(8/12/2003)
52
Seudopaneles.
• Deaton (1985).
• Moffit (1993): extiende los resultados a paneles
dinámicos.
• Collado (1997): estimador MGM de paneles
dinámicos.
• Verbeeck y Vella (2000): estimación por VI.
• Girma (2000): transformación de cuasidiferencia
entre parejas de individuos.
• Atrás.
J.Muro(8/12/2003)
53
Deaton (1985).
• Construcción de cohortes (sexo y edad).
• Construir el panel con medias de cohortes.
• Utilizar el estimador de efectos fijos (hay
siempre correlación entre las medias de los
regresores y las medias de los efectos de
cohorte, ambas dependen del tiempo).
• Corregir el estimador intra por errores de
medida (de las medias poblacionales).
• Atrás
J.Muro(8/12/2003)
54
¿Cómo construir las cohortes?
• Hay un trade-off entre número de cohortes
(C) y número de miembros de cada cohorte
(nC).
• En general, los resultados mejoran cuando
nC crece.
• Si las cohortes muestran alta homogeneidad
interna y alta heterogeneidad externa,
también mejoran los resultados.
• Atrás
J.Muro(8/12/2003)
55
Paneles rotatorios.
• Biorn (1981), Biorn y Jansen (1983).
• Planteamiento clásico.
• La ordenación de las observaciones permite su clasificación
como un panel desequilibrado o un panel rotatorio específico.
• Bajo los supuestos habituales, la forma de la matriz de
varianzas y covarianzas es, para T=2 y rotación de la mitad de
la muestra.
• Esto permite obtener el estimador por MCG del panel.
• Otros análisis se hacen mutatis mutandis igual que
en un panel de datos.
• Atrás.
J.Muro(8/12/2003)
56
σ 2 I N / 2 0
0
0 


2
2
0 
 0
σ I N / 2 ση I N / 2
E (εε ' ) = Ω = 

2
2
0 
 0
ση I N / 2 σ I N / 2


2
0
0
σ I N / 2 
 0
σ 2 = σ η 2 + σν 2 .
Ω −1 / 2
J 2 = J 2 / 2; E 2 = I 2 − J 2 ;σ 1 * 2 = 2σ η + σ ν .
2
2
1

0
0 
 IN /2
σ

1
1


= 0
(
J2 +
E2 ) ⊗ I N / 2 0 .
σ1 *
σν


1


0
I N / 2  Atrás
 0
σ

J.Muro(8/12/2003)
57
Avery, R.B.; L.P. Hansen y V.J. Hotz (1983), “Multiperiod probit
models and orthogonality condition estimation”. International
Economic Review, 24, págs. 21-35.
Baltagi, B.H. (1995), Econometric Analysis of Panel Data. John
Wiley. Nueva York.
Biorn, E. (1981), “Estimating economic relations from incomplete
cross-section/time-series data”. Journal of Econometrics, 16,
págs. 221-236.
Biorn, E. y E.S. Jansen (1983), “Individual effects in a system of
demand functions”. Scandinavian Journal of Economics, 85,
págs. 461-483.
Björklund, A. (1985) “Unemployment and mental health: some
evidence from panel data”. The Journal of Human Resources,
20, págs. 469-483.
Bover, O. y M. Arellano (1997), “Estimating dynamic limited
dependent variable models from panel data”. Investigaciones
Económicas, 21, págs. 141-165.
J.Muro(8/12/2003)
58
Butler, J.S. y R.A.Moffit (1982), ”A computationally efficient
quadrature procedure for the one-factor multinomial probit
model”. Econometrica, 50, págs. 761-764.
Chamberlain, G. (1980), “Analysis of covariance with qualitative
data”. Review of Economic Studies, 47, págs. 225-238.
Chamberlain, G. (1984), “Panel data”. Cap. 22 en Z. Griliches y M.
Intriligator (eds.) Handbook of Econometrics. North Holland.
Págs. 1247-1318.
Chamberlain, G. (1985), “Heterogeneity, omitted variable bias and
duration dependence”. Cap. 1 en J. J. Heckman y B. Singer (eds.)
Longitudinal analysis of labor market data. Cambridge University
Press. Págs. 3-38.
Collado, M.D. (1997), “Estimating dynamic models from time series
of independent cross-sections”, Journal of Econometrics, 82, págs.
37-62.
Deaton, A. (1985), “Panel data from time series of cross-sections”.
Journal of Econometrics, 30,
págs. 109-126.
J.Muro(8/12/2003)
59
Girma, S. (2000), “A quasi-differencing approach to dynamic
modelling from a time series of independent cross-sections”.
Journal of Econometrics, 98, págs. 365-383.
Heckman, J.J. (1981), “The incidental parameters problem and the
problem of initial conditions in estimating a discrete time-discrete
data stochastic process”. En C.F. Mansky y D. McFadden (eds.)
Structural analysis of discrete data with econometric applications,
págs. 179-195.
Heckman, J.J. y T.E. MaCurdy (1980), “A life-cycle model of female
labour supply”. Review of Economic Studies, 47, págs. 47-74.
Honoré, B.E. (1992), “Trimmed LAD and least squares estimation of
truncated and censored regression models with fixed effects”.
Econometrica, 60, págs. 533-565.
Honoré, B.E. (1993), “Orthogonality conditions for tobit models with
fixed effects and lagged dependent variables”. Journal of
Econometrics, 59, págs. 35-61.
J.Muro(8/12/2003)
60
Honoré, B.E. y E. Kyriazidou (2000a), “Estimation of tobit-type
models with individual specific effects”. Econometric Reviews,
19, págs. 341-366.
Honoré, B.E. y E. Kyriazidou (2000b), “Panel data discrete
choice models with lagged dependent variables”.
Econometrica, 68, págs. 839-874.
Kyriazidou, E. (1997), “Estimation of a panel data sample
selection model”. Econometrica, 65, págs. 1335-1364.
Lancaster, T. (2000), “The incidental parameter problem since
1948”. Journal of Econometrics, 95, págs. 391-413.
Lee, M.J. (2001), “First-difference estimator for panel censoredselection models”. Economics Letters, 70, págs. 43-49.
Magnac, T. (1997), “State dependence and heterogeneity in youth
unemployment histories”. WP, INRA y CREST.
Manski, C. (1975), “Maximum score estimation of the stochastic
utility model of choice”. Journal of Econometrics, 3, págs.
J.Muro(8/12/2003)
61
205-228.
Manski, C. (1987), “Semiparametric analysis of random effects
linear models from binary panel data”. Econometrica, 55,
págs. 357-362.
Moffit, R. (1993), “Identification and estimation of dynamic
models with a time series of repeated cross-sections”. Journal
of Econometrics, 59, págs. 99-123.
Neyman, J. y E.L. Scott (1948), “Consistent estimation from
partially consistent observations”. Econometrica, 16, págs. 132.
Powell, J.L. (1986) “Symmetrically trimmed least squares
estimation for tobit models”. Econometrica, 54, págs. 14351460.
Vella, F. y M. Verbeeck (1999),”Two-step estimation of panel
data models with censored endogenous variables and selection
bias”. Journal of Econometrics, 90, págs. 239-263.
Verbeeck, M. y F. Vella (2000), “Estimating dynamic models
from repeated cross-sections”.
WP. KU Leuven.
J.Muro(8/12/2003)
62
Winkelmann, L. y R. Winkelmann (1998), “Why are the
unemplyed so unhappy? Evidence from panel data”.
Economica, 65, págs. 1-15.
Wooldrige, J.M. (1999), “Distribution-free estimation of some
nonlinear panel data models”. Journal of Econometrics, 90,
págs. 77-97.
Wooldrige, J.M. (2000), “A framework for estimating dynamic,
unobserved effects panel data models with possible feedback
to future explanatory variables”. Economics Letters, 68, págs.
245-250.
J.Muro(8/12/2003)
63