Download Modelos dinámicos de datos de panel(2).
Document related concepts
no text concepts found
Transcript
Modelos dinámicos de datos de panel(2). Siga J.Muro(8/12/2003) 1 Otros temas relevantes del enfoque de datos de panel. • Lo que trataremos: 1. Modelos no lineales para datos de panel. 2. Seudopaneles y paneles rotatorios. • Lo que no trataremos: 1. Atrición. Siga J.Muro(8/12/2003) 2 Modelos no lineales de datos de panel. • Introducción. • Enfoques: • Planteamiento clásico. • Modelos dinámicos. Siga J.Muro(8/12/2003) 3 Introducción. Y *it = Xitβ +ηi +ν it ,i = 1,2,..,N;t = 1,2,..,T. • Y* es una variable índice o latente. • Y es la variable observada. Regla de observación: • Y = 1{Y*>0}. Modelos logit, probit. • Y = max (Y*,0). Modelo tobit (tipo I). • Y = 1{Y*2>0}*Y*. Modelo heckit (tobit tipo II). • Queda mucho por hacer (cuerpo general). • ¿Efectos fijos o aleatorios? • Siga. J.Muro(8/12/2003) 4 Introducción. Y *it = Xitβ +ηi +ν it ,i = 1,2,..,N;t = 1,2,..,T. • Problema: aunque X sea estrictamente exógena (supuesto aún habitual), la no observación de Y* hace que β no esté identificada (sin restricciones adicionales). • Transformaciones que eliminan efectos fijos dependen del carácter aditivo o multiplicativo de dichos efectos. • ¿Por qué no utilizar el modelo lineal de probabilidad? J.Muro(8/12/2003) • Siga. 5 ¿Modelo lineal de probabilidad? • No es conveniente (aunque no se excluye) por las razones habituales: • Predicciones no acotadas en 0-1. • Heteroscedasticidad. • Comportamiento regular de los efectos individuales, − X 'it β ≤ ηi ≤ 1 − X 'it β , t = 1,2,...,T . Atrás J.Muro(8/12/2003) 6 Introducción. • Máxima verosimilitud frente a máxima verosimilitud parcial. • Máxima verosimilitud condicional. • Atrás J.Muro(8/12/2003) 7 Planteamiento clásico de modelos no lineales. • Modelos dicotómicos. • Modelo de variable dependiente censurada. • Modelo de variable dependiente con selección muestral. Atrás J.Muro(8/12/2003) 8 Modelos dicotómicos. • ¿Efectos fijos o aleatorios? • Depende de posibilidades teóricas: máxima verosimilitud condicional u otras. • Depende de posibilidades de cálculo. • Modelos para efectos fijos. • modelo logit. (probit intratable por ahora). • enfoque semiparamétrico, Manski (1987). • Modelos para efectos aleatorios • modelo probit. Atrás J.Muro(8/12/2003) 9 Modelo logit. y *it = X'it β +ηi +ν it . • Regla de observación, en presencia de efectos fijos: Prob[ yit = 1] = Prob[ y *it > 0] = = Prob[ν it > − X 'it β − ηi ] = G( X 'it β + ηi ). • G(.) es una función de distribución simétrica. • Problema de parámetros incidentales, Neyman y Scott (1948), Lancaster (2000). • Chamberlain (1980) demuestra que el problema no se elimina con las transformaciones usadas en modelos con Siga variables continuas (dif.; fe; ortog.). J.Muro(8/12/2003) 10 Modelo logit. • Estimación. • Chamberlain (1980), máxima verosimilitud condicional. Atrás J.Muro(8/12/2003) 11 Modelo logit. Chamberlain (1980). • El problema de los parámetros incidentales se resuelve mediante un estadístico suficiente mínimo para ηi. • Maximización de verosimilitud condicional. T Lc = ∏ Pr ob yi1....... yiT | ∑ yit , i =1 i =1 N • Como se ve la verosimilitud es condicional a un estadístico suficiente para los efectos fijos. • Equivale matemáticamente al estimador de un logit condicional. • Ejemplo. Atrás • Contraste. • Estudios empíricos. J.Muro(8/12/2003) 12 Aclaración • Un estadístico suficiente es una función de los datos de tal forma que la distribución de los datos condicional al estadístico no depende de los parámetros representativos de la heterogeneidad individual. Pero al condicionar podemos no eliminar los parámetros de interés. • Atrás. J.Muro(8/12/2003) 13 Supongamos T = 2, fijo. La suma que condiciona la expresión de la función de verosimilitud, sólo puede tomar los valores siguientes: 0, 1, 2. Las únicas informativas son aquellas para las que la suma condicionante toma el valor 1. La expresión general de un modelo logit es, exp ( X ' it β + η i ) . Prob [ y it = 1 ] = 1 + exp ( X ' it β + η i ) Y la contribución informativa de las observaciones de nuestra muestra es, J.Muro(8/12/2003) 14 Prob[ yi1 = 1, yi 2 = 0 | yi1 + yi 2 = 1] = 1 1 + exp(( Xi 2 − Xi1 )' β ) . exp(( X i 2 − X i1 )' β ) . Prob[ yi1 = 0, yi 2 = 1 | yi1 + yi 2 = 1] = 1 + exp(( X i 2 − X i1 )' β ) Como se ve se han eliminado los efectos individuales. Cabe usar un programa estándar de estimación de un logit sin más que utilizar la diferencia entre los valores observados en ambas olas como regresor. En el lado izquierdo se incluyen los valores de la variable dependiente como 1 cuando el individuo transita del 0 al 1 y 0 cuando el individuo transita del 1 al 0. Atrás J.Muro(8/12/2003) 15 Contraste. • Contraste del tipo Hausman. • Estimador del logit del panel completo es consistente y eficiente si no hay efectos individuales (H0). Si los hay (H1) es inconsistente. • Estimador condicional de Chamberlain (logit efectos fijos) es consistente bajo ambas hipótesis, e ineficiente bajo la nula. Atrás J.Muro(8/12/2003) 16 Estudios empíricos. • Björklund (1985): relación entre desempleo y problemas de salud mental. • Winkelman y Winkelman (1998): relación entre desempleo y satisfacción de los individuos. Atrás J.Muro(8/12/2003) 17 Modelo probit. • Aunque hasta ahora resulta inabordable en presencia de efectos fijos proporciona buenos resultados para paneles con efectos aleatorios. • La estimación maximoverosímil proporciona estimadores consistentes. • Plantea problemas de cálculo elevados. Butler y Moffit (1982): procedimiento de cuadratura Gaussiana (ej. Stata). • Supuestos implícitos: • no correlación entre variables del lado derecho y componentes específicos del término de error del modelo. • Contrastes: • Avery, Hansen y Hotz (1983) introducen un contraste de exogeneidad. • Alternativas de estimación. J.Muro(8/12/2003) 18 Modelo probit (estimación). • No hay correlación: Avery, Hansen y Hotz (1983) una estimación del modelo mediante el método generalizado de momentos (MGM). • Hay correlación: añadir nuevos supuestos de identificación. • estimador de mínima distancia de Chamberlain (1984). • estimador intra en dos etapas de Bover y Arellano (1997), que es consistente y asintóticamente normal para T fijo y que admite entre las variables del lado derecho retardos de la variable del lado izquierdo, variables exógenas y términos de heterogeneidad individual inobservada. Atrás J.Muro(8/12/2003) 19 Estimador de Manski (1987). • Estimación consistente de un modelo no lineal de datos de panel con efectos individuales (no se puede aplicar MV condicional). • Idea básica: estimador de modelo dicotómico de Manski (1975). • Intuición: bajo estacionariedad de uit la generalización del logit dicotómico que conduce al logit de efectos fijos se producirá igual entre el estimador semiparamétrico de Manski y el nuevo estimador de Manski para datos de panel con efectos fijos. • Método. • Propiedades: consistente, no converge a raíz cuadrada de N; no es asintóticamente normal. Admite correlación y Atrás heteroscedasticidad transversal. No admite efectos temporales (v. ficticias temporales). J.Muro(8/12/2003) 20 Estimador de Manski (1975). • Estimador de tanteo (puntuación) máximo (maximum score): proporciona una estimación consistente de los parámetros de un modelo dicotómico, salvo un factor de escala. • Método semiparamétrico ( de ajuste). • Idea. • Función a maximizar. Atrás J.Muro(8/12/2003) 21 y i = 1{X ' i β + u i ≥ 0}. P ( y i = 1 | X i ) = P ( u i | X ≥ − X ' i β ). Si la mediana de la distribución de u condicionada a X es cero, las observaciones para las que X’iβ sea positivo tendrán probabilidades superiores a ½, mientras que las que tienen el valor del índice negativo tendrán probabilidades inferiores a ½. Lo anterior se puede expresar como, signo [P ( y i = 1 | X i ) − P ( y i = 0 | X i ) ] = signo ( X ' i β ). Si queremos maximizar el tanteo, los aciertos, habrá que maximizar el número de veces en que coincide el signo de la predicción (X’ib) con el signo de (2yi- 1). Atrás J.Muro(8/12/2003) 22 1 N N ∑ {[2 y i − 1 − (1 − 2α ) ] signo ( X ' i β )}. i =1 El estimador resultante es consistente pero no converge a la tasa habitual de la raíz cuadrada de N. Su distribución asintótica no es normal. Atrás J.Muro(8/12/2003) 23 Para T=2 P ( y i 2 = 1 | x i 1 , x i 2 , y i 1 + y i 2 = 1) ≤ 1 / 2 > Si ( x i 2 − x i1 )β ≤ 0. > La función a maximizar es 1 N N ∑ signo ( y i2 − y i 1 ) signo (( x i 2 − x i 1 ) β ). i =1 Si T>2, la función a maximizar se construye mediante la comparación de todas las parejas de observaciones posibles. J.Muro(8/12/2003) Atrás 24 Modelos de variable censurada. • Efectos fijos. • Efectos aleatorios. Atrás J.Muro(8/12/2003) 25 Modelos de variable censurada (efectos fijos). • Heckman y MaCurdy (1980): oferta de trabajo femenina a lo largo del ciclo vital. • Modelos semiparamétricos: • Honoré (1992). • Honoré y Kyriazidou (2000a). Atrás J.Muro(8/12/2003) 26 Heckman-MaCurdy(1980). • Modelo: Y it * = X it β + η i + ν it , Y it = max( Y it *, 0 ). i = 1,2,.., N; t = 1,2,.., T. • Las transformaciones de modelos lineales no eliminan los efectos fijos (por la parte no lineal de la variable dependiente). Aparece nuevamente el problema de los parámetros incidentales. • Procedimiento de estimación: máxima verosimilitud iterativa. Atrás J.Muro(8/12/2003) 27 Honoré(1992). Y it * = X it β + η i + ν it ,Yit = max( Y it *, 0 ). i = 1,2,.., N; t = 1,2,.., T. • Intuición: Si censuramos artificialmente la variable dependiente se podrán eliminar los efectos individuales mediante diferencia (Powell (1986)). • Estimador arreglado o aparejado que minimiza la suma de los errores absolutos (trimmed LAD) o que minimiza la suma de los errores al cuadrado (trimmed LS). • νit|Xit,ηi es iid~N(0,σν2). • La distribución de la variable latente es simétrica y esta simetría se transmite a la distribución de los valores observados (para los verdaderos valores de los Siga parámetros). J.Muro(8/12/2003) 28 Veamos lo anterior desde el punto de vista de los residuos eist (b) = max{yis , ( xis − xit )b}− max{0, ( xis − xit )b}. Para b = β se cumple eist (β ) = max{yis , ( xis − xit )β }− max{0, ( xis − xit )β } = = max{ηi +ν is ,− xisβ ,− xit β }− max{− xisβ ,− xit β }. Expresión que es simétrica en s y t. Atrás J.Muro(8/12/2003) 29 Honoré(1992). • El estimador MGM (con restricciones de ortogonalidad que nacen del supuesto del párrafo anterior) es consistente y con distribución asintótica normal. • Los resultados para muestras pequeñas son razonables a partir de N≥200. Atrás J.Muro(8/12/2003) 30 Si suponemos νit, νit iid condicionado a xi, ηi, para T=2, la función a minimizar es N ∑(max{y }− max{yi 2 ,−∆xi b}− ∆xi b) i1 , ∆xi b 2 + i =1 + 2*1{yi1 < ∆xi b}(∆xi b − yi1 ) yi 2 + + 2*1{yi 2 < −∆xi b}(−∆xi b − yi 2 ) yi1 . Para T>2 se tienen en cuenta todas las parejas posibles. Atrás J.Muro(8/12/2003) 31 Kyriazidou(1997). • Modelo semiparamétrico. • Sugiere realizar la exploración de los puntos siguientes: • Primero estimar la ecuación de selección por un logit de efectos fijos o probit de efectos aleatorios. • Segundo aplicar primeras diferencias en la ecuación de interés a fin de eliminar los efectos fijos de las observaciones no censuradas. • A continuación el análisis se centra en las observaciones para las que x’itβ1=x’isβ1. En estos individuos tomar primeras diferencias no sólo elimina los efectos fijos sino también la selección muestral. • Por lo tanto el procedimiento de estimación sugerido es: J.Muro(8/12/2003) Atrás 32 Kyriazidou(1997). • Dos etapas a la Heckman. • Primero, se estima la ecuación de selección por un logit de efectos fijos o probit de efectos aleatorios. • Segundo, se estiman los parámetros de la ecuación de interés mediante MCO en la ecuación en diferencias pero dando mayor ponderación a las observaciones para las que se cumpla la condición de simetría anterior. • El sistema de ponderación se realiza por un procedimiento no paramétrico (kernel) con ancho de banda (bandwidth) que se acerca a 0 a medida que el tamaño de muestra se incrementa. • La estimación es muy sensible a la elección del tamaño de ancho de banda. Atrás J.Muro(8/12/2003) 33 Relajación del supuesto de exogeneidad estricta. Y it = X it β + η i + ν it , i = 1,2,.., N; t = 1,2,..,T. • Modelos clásicos de datos de panel: exogeneidad estricta de los regresores. • Modelos dinámicos de datos de panel: se relaja el supuesto de exogeneidad estricta. Atrás J.Muro(8/12/2003) 34 Supuesto de exogeneidad estricta. Y it = X it β + η i + ν it , i = 1,2,.., N; t = 1,2,..,T. • E(Xitνis|ηi)= E(νis |Xit,ηi)=0, √ t,s. • Sólo se cumple la restricción incondicional en el caso de modelos de efectos aleatorios. • No hay retroalimentación. • Proporciona condiciones de identificación del vector de parámetros β. • Fuentes de persistencia: heterogeneidad Atrás inobservada. J.Muro(8/12/2003) 35 E (Y it | X it ,η i ) = X it β + η i . Una vez controlado el efecto de los regresores y de los efectos individuales, el valor esperado de la variable de interés sólo depende de los valores contemporáneos de los regresores y heterogeneidad inobservada. Ej. salarios en función de la edad. La edad pasada no influye sobre los salarios actuales y éstos últimos no influyen sobre la edad futura. Esto mismo ocurre con shocks asociados con la edad. Si el salario mínimo depende de la edad, y ésta es estrictamente exógena, los salarios presentes no afectan al valor futuro del shock. Atrás J.Muro(8/12/2003) 36 Restricciones de momentos secuenciales. Y it = X it β + η i + ν it , i = 1,2,.., N; t = 1,2,..,T. • Al margen de la correlación entre X y η. • El término de error genérico está incorrrelacionado con los valores contemporáneos y retardados de los regresores (pero correlacionado con los futuros). E (ν it | X it , X it −1 ,.... X i 1 ,η i ) = 0 , t = 1,2,.., T. • Los regresores son secuencialmente exógenos, condicionados a los efectos individuales. J.Muro(8/12/2003) 37 Regresores secuencialmente exógenos. E (Y it | X it , X it −1 ,..., X i 1 ,η i ) = X it β + η i • Una vez que se controla por los efectos de los regresores y de la heterogeneidad individual inobservada, los valores pasados de los regresores no afectan al valor esperado contemporáneo de Y. • Permite que haya retroalimentación. Atrás J.Muro(8/12/2003) 38 Introducción. • La mera introducción de un retardo de la variable dependiente quiebra los supuestos que permiten la identificación en el enfoque clásico. • Casi todo por hacer. • Efectos fijos: soluciones particulares. • Efectos aleatorios: problema de las condiciones iniciales (a través de la compleja relación entre la variable dependiente retardada, la heterogeneidad inobservada, los parámetros del modelo y la distribución de los regresores). Heckman (1981) Siga J.Muro(8/12/2003) 39 Dependencia entre estados y heterogeneidad. yit = 1 xitβ +δ yi,t -1 +ηi +νit ≥ 0 . • Fuentes de persistencia: correlación serial (νit); heterogeneidad inobservada (ηi); dependencia entre estados (δ). • Consecuencias importantes de cara a los efectos de las medidas de política económica. Ej. het. mide la selección adversa y la dependencia entre estados (verdadera) el azar moral. • Definiciones. Atrás • Modelos. J.Muro(8/12/2003) 40 Definiciones. • Dependencia espúrea entre estados. • Se dice que existe cuando la experiencia de un individuo no altera sus preferencias. Aparentemente hay una dependencia entre estados porque bien la heterogeneidad individual inobservada, bien la correlación entre aspectos no controlados, ocasionan un comportamiento similar en el futuro. • Dependencia verdadera entre estados. • Se dice que existe cuando la experiencia de un individuo modifica sus preferencias de forma que su comportamiento en el futuro es diferente del de otro individuo idéntico que no haya tenido dicha experiencia. Su medida implica controlar de manera adecuada la presencia de heterogeneidad inobservada y correlación serial entre los residuos (y condiciones iniciales). • Heterogeneidad inobservada. • Aspectos intrínsecos individuales (idiosincrasia), y permanentes en el tiempo, que explican el comportamiento diferencial de los individuos (con idénticas características observadas). Atrás J.Muro(8/12/2003) 41 Modelos. • Lo que se presenta: • Modelos dicotómicos. • Lo que no se presenta: • Modelos con variable dependiente censurada. • Modelos con variable dependiente sometida a selección muestral. Atrás J.Muro(8/12/2003) 42 Modelos dicotómicos dinámicos. yit = 1 xitβ +δ yi,t-1 +ηi +νit ≥ 0 . • Chamberlain (1985). • Honoré y Kyriazidou (2000b). Atrás J.Muro(8/12/2003) 43 Chamberlain (1985). yit = 1 δ yi,t -1 + ηi +ν it ≥ 0 . • Generalización del estimador por máxima verosimilitud condicional del logit de efectos fijos. • Para T≥4, condicionar la verosimilitud elimina también los efectos fijos. • En ausencia de autocorrelación, eso permite el contraste de la dependencia entre estados. Atrás J.Muro(8/12/2003) 44 Para el periodo inicial, el resultado es observado pero su probabilidad es desconocida. P(Yi0 = 1|ηi) = p0(ηi). Para cualquier periodo distinto del inicial, P(Yit = 1 | η i ,Yi 0 ,Yi1 ,..,Yi ,t −1 ) = ( exp δYi ,t −1 + ηi ( ) 1 + exp δYi ,t −1 + ηi ) . En consecuencia, si se condiciona sobre la suma de las Y y sobre los efectos individuales, la expresión elimina los efectos individuales. Magnac (1997) contiene resultados similares para el logit multinomial. Atrás J.Muro(8/12/2003) 45 Honoré y Kyriazidou (2000b). { } y it = 1 x it β + δ y i,t -1 + η i + ν it ≥ 0 . • Generalización del estimador de Chamberlain. Incluye variables exógenas. • Supuesto adicional: los errores del modelo que conduce a las condiciones iniciales (P0) son iid a lo largo del tiempo, con distribuciones logísticas e independientes del vector (x’i, ηi, yi0) para cualquier periodo de tiempo. • Aún así, para eliminar los efectos individuales, el análisis hay que restringirlo a las observaciones para las que x’i2= x’i3, o al menos muy próximas. J.Muro(8/12/2003) Atrás 46 Modelos dinámicos con variable dependiente censurada. yit = 1 xitβ +δ yi,t-1 +ηi +νit ≥ 0 . • Honoré (1993). Atrás J.Muro(8/12/2003) 47 Modelos dinámicos con selección muestral. yit = 1 xitβ +δ yi,t-1 +ηi +νit ≥ 0 . • Kyriazidou (1999). Atrás J.Muro(8/12/2003) 48 Generalidades. • Utilizar una transformación que elimine la heterogeneidad individual inobservada: máxima verosimilitud condicional. • Ciertos procedimientos de aparejar o arreglar las observaciones. • Completar la estructura de modelos con efectos aleatorios. Atrás J.Muro(8/12/2003) 49 Otras alternativas. • Arellano (1993). • Contraste robusto a heteroscedasticidad y autocorrelación de forma desconocida. yi + X i + 0 β ui + = + . y X ' X ' γ u i i i i • donde J.Muro(8/12/2003) 50 1/ 2 T −t 1 ( ) y y ... y t = 1 , 2 ,.... T − 1 . − + + it i , t + 1 iT T −t +1 T −t + yit = • El contraste se reduce al de H0: γ=0. • Debido a la presencia de heteroscedasticidad y autocorrelación de forma desconocida la matriz de varianzas y covarianzas a utilizar es la sugerida por White (1980). J.Muro(8/12/2003) 51 Seudopaneles y paneles rotatorios. • Seudopaneles. Combinación de varios cortes transversales representativos e independientes, que corresponden a periodos diferentes. • Paneles rotatorios. Sustitución de un porcentaje de la muestra por nuevos entrevistados después de un número de periodos de permanencia. Comprenden características comunes a los seudopaneles y a los paneles. J.Muro(8/12/2003) 52 Seudopaneles. • Deaton (1985). • Moffit (1993): extiende los resultados a paneles dinámicos. • Collado (1997): estimador MGM de paneles dinámicos. • Verbeeck y Vella (2000): estimación por VI. • Girma (2000): transformación de cuasidiferencia entre parejas de individuos. • Atrás. J.Muro(8/12/2003) 53 Deaton (1985). • Construcción de cohortes (sexo y edad). • Construir el panel con medias de cohortes. • Utilizar el estimador de efectos fijos (hay siempre correlación entre las medias de los regresores y las medias de los efectos de cohorte, ambas dependen del tiempo). • Corregir el estimador intra por errores de medida (de las medias poblacionales). • Atrás J.Muro(8/12/2003) 54 ¿Cómo construir las cohortes? • Hay un trade-off entre número de cohortes (C) y número de miembros de cada cohorte (nC). • En general, los resultados mejoran cuando nC crece. • Si las cohortes muestran alta homogeneidad interna y alta heterogeneidad externa, también mejoran los resultados. • Atrás J.Muro(8/12/2003) 55 Paneles rotatorios. • Biorn (1981), Biorn y Jansen (1983). • Planteamiento clásico. • La ordenación de las observaciones permite su clasificación como un panel desequilibrado o un panel rotatorio específico. • Bajo los supuestos habituales, la forma de la matriz de varianzas y covarianzas es, para T=2 y rotación de la mitad de la muestra. • Esto permite obtener el estimador por MCG del panel. • Otros análisis se hacen mutatis mutandis igual que en un panel de datos. • Atrás. J.Muro(8/12/2003) 56 σ 2 I N / 2 0 0 0 2 2 0 0 σ I N / 2 ση I N / 2 E (εε ' ) = Ω = 2 2 0 0 ση I N / 2 σ I N / 2 2 0 0 σ I N / 2 0 σ 2 = σ η 2 + σν 2 . Ω −1 / 2 J 2 = J 2 / 2; E 2 = I 2 − J 2 ;σ 1 * 2 = 2σ η + σ ν . 2 2 1 0 0 IN /2 σ 1 1 = 0 ( J2 + E2 ) ⊗ I N / 2 0 . σ1 * σν 1 0 I N / 2 Atrás 0 σ J.Muro(8/12/2003) 57 Avery, R.B.; L.P. Hansen y V.J. Hotz (1983), “Multiperiod probit models and orthogonality condition estimation”. International Economic Review, 24, págs. 21-35. Baltagi, B.H. (1995), Econometric Analysis of Panel Data. John Wiley. Nueva York. Biorn, E. (1981), “Estimating economic relations from incomplete cross-section/time-series data”. Journal of Econometrics, 16, págs. 221-236. Biorn, E. y E.S. Jansen (1983), “Individual effects in a system of demand functions”. Scandinavian Journal of Economics, 85, págs. 461-483. Björklund, A. (1985) “Unemployment and mental health: some evidence from panel data”. The Journal of Human Resources, 20, págs. 469-483. Bover, O. y M. Arellano (1997), “Estimating dynamic limited dependent variable models from panel data”. Investigaciones Económicas, 21, págs. 141-165. J.Muro(8/12/2003) 58 Butler, J.S. y R.A.Moffit (1982), ”A computationally efficient quadrature procedure for the one-factor multinomial probit model”. Econometrica, 50, págs. 761-764. Chamberlain, G. (1980), “Analysis of covariance with qualitative data”. Review of Economic Studies, 47, págs. 225-238. Chamberlain, G. (1984), “Panel data”. Cap. 22 en Z. Griliches y M. Intriligator (eds.) Handbook of Econometrics. North Holland. Págs. 1247-1318. Chamberlain, G. (1985), “Heterogeneity, omitted variable bias and duration dependence”. Cap. 1 en J. J. Heckman y B. Singer (eds.) Longitudinal analysis of labor market data. Cambridge University Press. Págs. 3-38. Collado, M.D. (1997), “Estimating dynamic models from time series of independent cross-sections”, Journal of Econometrics, 82, págs. 37-62. Deaton, A. (1985), “Panel data from time series of cross-sections”. Journal of Econometrics, 30, págs. 109-126. J.Muro(8/12/2003) 59 Girma, S. (2000), “A quasi-differencing approach to dynamic modelling from a time series of independent cross-sections”. Journal of Econometrics, 98, págs. 365-383. Heckman, J.J. (1981), “The incidental parameters problem and the problem of initial conditions in estimating a discrete time-discrete data stochastic process”. En C.F. Mansky y D. McFadden (eds.) Structural analysis of discrete data with econometric applications, págs. 179-195. Heckman, J.J. y T.E. MaCurdy (1980), “A life-cycle model of female labour supply”. Review of Economic Studies, 47, págs. 47-74. Honoré, B.E. (1992), “Trimmed LAD and least squares estimation of truncated and censored regression models with fixed effects”. Econometrica, 60, págs. 533-565. Honoré, B.E. (1993), “Orthogonality conditions for tobit models with fixed effects and lagged dependent variables”. Journal of Econometrics, 59, págs. 35-61. J.Muro(8/12/2003) 60 Honoré, B.E. y E. Kyriazidou (2000a), “Estimation of tobit-type models with individual specific effects”. Econometric Reviews, 19, págs. 341-366. Honoré, B.E. y E. Kyriazidou (2000b), “Panel data discrete choice models with lagged dependent variables”. Econometrica, 68, págs. 839-874. Kyriazidou, E. (1997), “Estimation of a panel data sample selection model”. Econometrica, 65, págs. 1335-1364. Lancaster, T. (2000), “The incidental parameter problem since 1948”. Journal of Econometrics, 95, págs. 391-413. Lee, M.J. (2001), “First-difference estimator for panel censoredselection models”. Economics Letters, 70, págs. 43-49. Magnac, T. (1997), “State dependence and heterogeneity in youth unemployment histories”. WP, INRA y CREST. Manski, C. (1975), “Maximum score estimation of the stochastic utility model of choice”. Journal of Econometrics, 3, págs. J.Muro(8/12/2003) 61 205-228. Manski, C. (1987), “Semiparametric analysis of random effects linear models from binary panel data”. Econometrica, 55, págs. 357-362. Moffit, R. (1993), “Identification and estimation of dynamic models with a time series of repeated cross-sections”. Journal of Econometrics, 59, págs. 99-123. Neyman, J. y E.L. Scott (1948), “Consistent estimation from partially consistent observations”. Econometrica, 16, págs. 132. Powell, J.L. (1986) “Symmetrically trimmed least squares estimation for tobit models”. Econometrica, 54, págs. 14351460. Vella, F. y M. Verbeeck (1999),”Two-step estimation of panel data models with censored endogenous variables and selection bias”. Journal of Econometrics, 90, págs. 239-263. Verbeeck, M. y F. Vella (2000), “Estimating dynamic models from repeated cross-sections”. WP. KU Leuven. J.Muro(8/12/2003) 62 Winkelmann, L. y R. Winkelmann (1998), “Why are the unemplyed so unhappy? Evidence from panel data”. Economica, 65, págs. 1-15. Wooldrige, J.M. (1999), “Distribution-free estimation of some nonlinear panel data models”. Journal of Econometrics, 90, págs. 77-97. Wooldrige, J.M. (2000), “A framework for estimating dynamic, unobserved effects panel data models with possible feedback to future explanatory variables”. Economics Letters, 68, págs. 245-250. J.Muro(8/12/2003) 63