Download Taller Análisis de Datos Multinivel (2da parte)

Document related concepts
no text concepts found
Transcript
Taller
Análisis de Datos Multinivel (2da parte)
Sergio R. Muñoz, Ph.D.
CIGES & Departamento Salud Publica
Facultad de Medicina
Universidad de La Frontera
[email protected]
12-25 de Mayo, 2012
Software
• SAS:
– proc mixed (modelos de efectos aleatorios)
– Macros: GLMMIX y NLINMIX para ajuste de
modelos con variable de respuesta discreta
• SPSS:
– comando varcomp (solo modelo de intercepto
aleatorio)
– Version 11 modulo de Modelos avanzados
• Modelo de efectos aleatorios
• Modelos multinivel
Software (2)
• BMDP:
– Modulo 3V y otros permiten el ajuste de algunos casos
particulares de modelos multinivel
• Stata:
– La serie de comandos xt permiten ajustar modelos
multinivel cuando los sujetos son seguidos en el
tiempo
– Archivo ado: gllamm permite el ajuste de modelos
enmarcados dentro de los llamados Modelos mixtos y
lineales de variables latentes. Ver STB-53
Software (3)
• Especializados:
– PinT: Diseños de dos niveles. Puede ser bajado
desde http://stat.gamma.rug.nl/snijders/multilevel.htm
– Mplus: modelos para estructura de covarianzas
– BUGS: para modelos bayesianos usando
metodo de Gibbs
– MLA: Estima coeficientes para modelos de dos
niveles usando metodos de remuestreo
Software (4)
• MLwiN
– Producido por “Multilevel Models Project” del
Instituto de Educacion de la Universidad de
Londres
– Version 2.20 de Junio de 2010
• Modelo de dos niveles variable continua
• Modelo para respuesta binaria
• Modelo para variable discreta
• Respuesta multivariada
• Modelos de cadenas de Markov
• Otros
http://www.cmm.bristol.ac.uk/index.shtml
Sesion
datos
•
•
•
•
•
•
•
school
student
normexam
Cons
standlrt
girl
schgen
•
•
•
•
•
•
•
Identificador
Identificador
Puntaje examen a los 16 años
1
Puntaje examen a los 11 años
0=hombre; 1=mujer
Tipo de escuela: 1=mixta; 2=hombres;
3=mujeres
Promedio de notas en mujeres y hombres
MODELO PARA COMPARAR
PROMEDIOS ENTRE 2 GRUPOS
Modelamiento
Estimación de parámetros
Puntaje promedio entre las escuelas
MODELO PARA LA COMPARACIÓN
DE MAS DE 2 PROMEDIOS:
MODELO DE EFECTOS FIJOS
65 escuelas
• Objetivo: Comparar puntaje promedio entre
las 65 escuelas
• Modelo de efectos fijos
• Uso de variables “dummies”
• 65 escuelas => 64 variables dummies (se elige
una como base para la comparacion)
Yi  0  1 x1i   2 x2i  .......  64 x64i  ei
Creación de variables dummies
Modelo
Es significativa la diferencia de
promedios entre escuelas?
MODELO MULTINIVEL
Recordatorio
Modelo con 1 predictor a nivel individual y 1 predictor a nivel grupal
1era Etapa: Y     * X  
 ~ N 0, 2
ij
Respuesta individuo i
en grupo j
oj
1j
ij
ij
ij
Var explicatoria nivel
individual en individuo i
en grupo j


Independientes
dentro de cada grupo
2da Etapa: Coef de regresión especifico para cada grupo es modelado
Como una función de la variable de nivel grupal
0 j   00   01 * Z j   0 j
1 j  10  11 * Z j  1 j
Cov 0 j , 1 j   10
 0 j ~ N0, 00 
1 j ~ N0, 11 
Var explicatoria nivel grupal
Especificación
Visualización de la Estructura Jerárquica
Ejecutar el Modelo
Interpretación
• Media global de normexam=β0=-0.013
• El promedio de las diferentes escuelas se
distribuyen alrededor de la media global con
una varianza estimada de 0.169
• La varianza entre escuelas es estimada por
σ2u=0.169
• La varianza entre estudiantes dentro de una
escuela es estimada por σ2e=0.848
Pruebas de Hipótesis
• H0: σ2u=0 [equivale a no diferencia de promedios entre
escuelas]
• Z=0.169/0.032=5.3 => p<0.001 (Wald test)
• Prueba de razón de verosimilitud:
– {-2LKH(modelo nulo)} - {-2LKH(modelo actual)}
– Chi2 1 gl
– 11509.36 – 11010.65=498.71
• Conclusión: Hay variación estadísticamente significativa entre
escuelas
• Que porcentaje de variación es debida a la diferencia entre
escuelas?
– Coef de partición de varianza=0.169/(0.169+0.848)=0.166
La diferencia de puntajes entre escuelas se mantiene al
ajustar por puntaje de ingreso?
MODELO MAS COMPLEJO: INTERCEPTOS Y
PENDIENTES ALEATORIAS
Modelo de regresión lineal simple
MMn
•Cada escuela tiene su propio intercepto, β0j, pero todas
tienen la misma pendiente
•Se ajusta una serie de lineas paralelas
•Se ajusta a la realidad?
El coeficiente de standlrt varia
entre las escuelas?
Comparación entre modelos
Taller
Análisis de Datos Multinivel
Sergio R. Muñoz, Ph.D.
CIGES & Departamento Salud Publica
Facultad de Medicina
Universidad de La Frontera
[email protected]
12-25 de Mayo, 2012