Download Models for Latent Values Edward J. Stanek III1
Document related concepts
no text concepts found
Transcript
Models for Latent Values Edward J. Stanek III 1 ABSTRACT Latent values are often not known since they may be measured with error or partially observed, but are important. Applications occur in medicine where latent values of serum, such as cholesterol, or glucose, are key parameters whose values are important in a treatment decision tree, but are measured with error. In behavioral studies to improve diet and enhance physical activity, latent values for saturated fat intake, or activity time, are important for tailoring treatment interventions, but are partially known due to short observation periods. We develop stochastic frameworks that include the label and response to estimate latent values in a simple example. The different ways that labels may be included are highlighted, and distinguish mixed models developed from a finite population sampling and Bayesian approach with exchangeable priors. We discuss the interpretation of realized random effects in each case, and the relationship with the underlying latent values. The development highlights the way in which label data may be ignored, or partially used in a prior specification for mixed models. When label data is partially used, we highlight the interpretation of random variables in the posterior distribution and interpretation of a realized random effect. Keywords: Realized Random Effects, Mixed Models, Best Linear Unbiased Predictors, Exchangeable Priors, Sampling, Finite Populations, Inference, Identifiable 1 Department of Public Health, University of Massachusetts at Amherst, USA Modelos para Valores Latente Edward J. Stanek III 1 RESUMEN Los valores latentes en general son desconocidos, ya que pueden ser medidos con error u observados parcialmente, aún así son un importante objeto de inferencia. Aplicaciones de este tipo de situaciones se presentan en Medicina, donde los valores latentes de suero, como el colesterol o la glucosa, son parámetros fundamentales en el árbol de decisión del tratamiento, pero se miden con error. En estudios de comportamiento para mejorar la dieta y aumentar la actividad física, los valores latentes de ingesta de grasas saturadas, o tiempo de actividad, son importantes para la adaptación de las intervenciones terapéuticas, pero se conocen parcialmente debido a que los períodos de observación son de corto plazo. En este trabajo desarrollamos modelos estocásticos que incluyen la etiqueta (identificación de la unidad) y la respuesta para estimar los valores latentes en un ejemplo sencillo. Se pone en evidencia diferentes formas en que se pueden incluir las etiquetas en el modelo, y se distinguen los modelos mixtos desarrollados a partir de un muestreo de una población finita y del enfoque Bayesiano con prioris intercambiables. Se discute la interpretación de efectos aleatorios realizados en cada caso, y su relación con los valores latentes subyacentes. Este desarrollo pone en evidencia la forma en que los datos con etiqueta pueden ser ignorados, o parcialmente usados en la especificación de la priori para los modelos mixtos. Cuando los datos con etiqueta son parcialmente utilizados, destacamos la interpretación de las variables aleatorias en la distribución a posteriori y la interpretación de los efectos aleatorios realizados. Palabras claves: Realizado efectos aleatorios, modelos mixtos, mejores predictores lineales imparciales, Priores intercambiables, Muestra, poblaciones finitas, Inferencia, identificación 1 Department of Public Health, University of Massachusetts at Amherst, USA