Download Taller Análisis de Datos Multinivel (2da parte)
Document related concepts
no text concepts found
Transcript
Taller Análisis de Datos Multinivel (2da parte) Sergio R. Muñoz, Ph.D. CIGES & Departamento Salud Publica Facultad de Medicina Universidad de La Frontera [email protected] 12-25 de Mayo, 2012 Software • SAS: – proc mixed (modelos de efectos aleatorios) – Macros: GLMMIX y NLINMIX para ajuste de modelos con variable de respuesta discreta • SPSS: – comando varcomp (solo modelo de intercepto aleatorio) – Version 11 modulo de Modelos avanzados • Modelo de efectos aleatorios • Modelos multinivel Software (2) • BMDP: – Modulo 3V y otros permiten el ajuste de algunos casos particulares de modelos multinivel • Stata: – La serie de comandos xt permiten ajustar modelos multinivel cuando los sujetos son seguidos en el tiempo – Archivo ado: gllamm permite el ajuste de modelos enmarcados dentro de los llamados Modelos mixtos y lineales de variables latentes. Ver STB-53 Software (3) • Especializados: – PinT: Diseños de dos niveles. Puede ser bajado desde http://stat.gamma.rug.nl/snijders/multilevel.htm – Mplus: modelos para estructura de covarianzas – BUGS: para modelos bayesianos usando metodo de Gibbs – MLA: Estima coeficientes para modelos de dos niveles usando metodos de remuestreo Software (4) • MLwiN – Producido por “Multilevel Models Project” del Instituto de Educacion de la Universidad de Londres – Version 2.20 de Junio de 2010 • Modelo de dos niveles variable continua • Modelo para respuesta binaria • Modelo para variable discreta • Respuesta multivariada • Modelos de cadenas de Markov • Otros http://www.cmm.bristol.ac.uk/index.shtml Sesion datos • • • • • • • school student normexam Cons standlrt girl schgen • • • • • • • Identificador Identificador Puntaje examen a los 16 años 1 Puntaje examen a los 11 años 0=hombre; 1=mujer Tipo de escuela: 1=mixta; 2=hombres; 3=mujeres Promedio de notas en mujeres y hombres MODELO PARA COMPARAR PROMEDIOS ENTRE 2 GRUPOS Modelamiento Estimación de parámetros Puntaje promedio entre las escuelas MODELO PARA LA COMPARACIÓN DE MAS DE 2 PROMEDIOS: MODELO DE EFECTOS FIJOS 65 escuelas • Objetivo: Comparar puntaje promedio entre las 65 escuelas • Modelo de efectos fijos • Uso de variables “dummies” • 65 escuelas => 64 variables dummies (se elige una como base para la comparacion) Yi 0 1 x1i 2 x2i ....... 64 x64i ei Creación de variables dummies Modelo Es significativa la diferencia de promedios entre escuelas? MODELO MULTINIVEL Recordatorio Modelo con 1 predictor a nivel individual y 1 predictor a nivel grupal 1era Etapa: Y * X ~ N 0, 2 ij Respuesta individuo i en grupo j oj 1j ij ij ij Var explicatoria nivel individual en individuo i en grupo j Independientes dentro de cada grupo 2da Etapa: Coef de regresión especifico para cada grupo es modelado Como una función de la variable de nivel grupal 0 j 00 01 * Z j 0 j 1 j 10 11 * Z j 1 j Cov 0 j , 1 j 10 0 j ~ N0, 00 1 j ~ N0, 11 Var explicatoria nivel grupal Especificación Visualización de la Estructura Jerárquica Ejecutar el Modelo Interpretación • Media global de normexam=β0=-0.013 • El promedio de las diferentes escuelas se distribuyen alrededor de la media global con una varianza estimada de 0.169 • La varianza entre escuelas es estimada por σ2u=0.169 • La varianza entre estudiantes dentro de una escuela es estimada por σ2e=0.848 Pruebas de Hipótesis • H0: σ2u=0 [equivale a no diferencia de promedios entre escuelas] • Z=0.169/0.032=5.3 => p<0.001 (Wald test) • Prueba de razón de verosimilitud: – {-2LKH(modelo nulo)} - {-2LKH(modelo actual)} – Chi2 1 gl – 11509.36 – 11010.65=498.71 • Conclusión: Hay variación estadísticamente significativa entre escuelas • Que porcentaje de variación es debida a la diferencia entre escuelas? – Coef de partición de varianza=0.169/(0.169+0.848)=0.166 La diferencia de puntajes entre escuelas se mantiene al ajustar por puntaje de ingreso? MODELO MAS COMPLEJO: INTERCEPTOS Y PENDIENTES ALEATORIAS Modelo de regresión lineal simple MMn •Cada escuela tiene su propio intercepto, β0j, pero todas tienen la misma pendiente •Se ajusta una serie de lineas paralelas •Se ajusta a la realidad? El coeficiente de standlrt varia entre las escuelas? Comparación entre modelos Taller Análisis de Datos Multinivel Sergio R. Muñoz, Ph.D. CIGES & Departamento Salud Publica Facultad de Medicina Universidad de La Frontera [email protected] 12-25 de Mayo, 2012