Download Models for Latent Values Edward J. Stanek III1

Document related concepts
no text concepts found
Transcript
Models for Latent Values
Edward J. Stanek III 1
ABSTRACT
Latent values are often not known since they may be measured with error or partially observed,
but are important. Applications occur in medicine where latent values of serum, such as cholesterol, or
glucose, are key parameters whose values are important in a treatment decision tree, but are measured
with error. In behavioral studies to improve diet and enhance physical activity, latent values for saturated
fat intake, or activity time, are important for tailoring treatment interventions, but are partially known due
to short observation periods. We develop stochastic frameworks that include the label and response to
estimate latent values in a simple example. The different ways that labels may be included are
highlighted, and distinguish mixed models developed from a finite population sampling and Bayesian
approach with exchangeable priors. We discuss the interpretation of realized random effects in each case,
and the relationship with the underlying latent values. The development highlights the way in which label
data may be ignored, or partially used in a prior specification for mixed models. When label data is
partially used, we highlight the interpretation of random variables in the posterior distribution and
interpretation of a realized random effect.
Keywords: Realized Random Effects, Mixed Models, Best Linear Unbiased Predictors, Exchangeable
Priors, Sampling, Finite Populations, Inference, Identifiable
1
Department of Public Health, University of Massachusetts at Amherst, USA
Modelos para Valores Latente
Edward J. Stanek III 1
RESUMEN
Los valores latentes en general son desconocidos, ya que pueden ser medidos con error u
observados parcialmente, aún así son un importante objeto de inferencia. Aplicaciones de este tipo de
situaciones se presentan en Medicina, donde los valores latentes de suero, como el colesterol o la glucosa,
son parámetros fundamentales en el árbol de decisión del tratamiento, pero se miden con error. En
estudios de comportamiento para mejorar la dieta y aumentar la actividad física, los valores latentes de
ingesta de grasas saturadas, o tiempo de actividad, son importantes para la adaptación de las
intervenciones terapéuticas, pero se conocen parcialmente debido a que los períodos de observación son
de corto plazo. En este trabajo desarrollamos modelos estocásticos que incluyen la etiqueta
(identificación de la unidad) y la respuesta para estimar los valores latentes en un ejemplo sencillo. Se
pone en evidencia diferentes formas en que se pueden incluir las etiquetas en el modelo, y se distinguen
los modelos mixtos desarrollados a partir de un muestreo de una población finita y del enfoque Bayesiano
con prioris intercambiables. Se discute la interpretación de efectos aleatorios realizados en cada caso, y su
relación con los valores latentes subyacentes. Este desarrollo pone en evidencia la forma en que los datos
con etiqueta pueden ser ignorados, o parcialmente usados en la especificación de la priori para los
modelos mixtos. Cuando los datos con etiqueta son parcialmente utilizados, destacamos la interpretación
de las variables aleatorias en la distribución a posteriori y la interpretación de los efectos aleatorios
realizados.
Palabras claves: Realizado efectos aleatorios, modelos mixtos, mejores predictores lineales imparciales,
Priores intercambiables, Muestra, poblaciones finitas, Inferencia, identificación
1
Department of Public Health, University of Massachusetts at Amherst, USA