Download 5-Estimación estadística
Document related concepts
Transcript
Estimación estadística Temas • • • • Parámetro y estimador Propiedades de un buen estimador Estimación puntual (Ejemplo aplicado) Estimación por intervalo (Ejemplo aplicado) 1 semana Parámetro y estimador • Un parámetro es una función definida sobre una variable que caracteriza a una población (constante). • Un estimador es un estadístico (una función de la muestra), usado para estimar un parámetro desconocido de la población. • En general se utilizan los estimadores que tengan las mejores propiedades. • En el proceso de estimación de un parámetro hay dos enfoques que responden a diferentes necesidades: la estimación puntual y la estimación por intervalo de confianza. Estimación puntual • Cuando se aproxima un parámetro de una distribución a través de un valor decimos que se está haciendo es una estimación puntual • Así, por ejemplo, la media muestral es una función de n variables aleatorias donde “n” es el tamaño de la muestra. • Para seleccionar un buen estimador entre un conjunto de posibles estimadores, los estadísticos propuestos son estudiados teniendo en cuenta ciertas propiedades deseables. Propiedades de un buen estimador • La elección de un estimador se realiza teniendo en cuenta, entre otros, los siguientes criterios: • Insesgamiento: Un estimador insesgado es aquel en el que la esperanza del estimador es igual al verdadero valor del parámetro. El sesgo del es definido como: Sesgo(ˆθ )=E(ˆθ - θ ). • Consistencia: A medida que aumenta el tamaño de la muestra, el valor del estimador tiende a ser el valor del parámetro. ^ E(q ) ® q ^ Var(q ) ® 0 Cuando n tiende a infinito Propiedades de un buen estimador • Eficiencia: Se refiere a la precisión (Variación). Un estimador es más eficiente que otro, si la varianza del primero es menor que la del segundo. • Robustez: Un estimador es Robusto si la violación de los supuestos de la estimación (Distribución), no altera de manera significativa los resultados. • Suficiencia: No puede obtenerse información adicional acerca del estado de la naturaleza, observando otros aspectos de a muestra que no intervengan en el estadístico suficiente. Ejemplo: La media muestral sería un estimador suficiente de la media poblacional, mientras que la mediana no. Estimadores Exactitud y Precisión Confiabilidad: Se refiere a la consistencia de los resultados. Se refiere a la concordancia de los resultados en dos o más ocasiones diferentes. Estimación Puntual Ejercicio (Estimar). Estimar la media, la desviación estandar y la frecuencia relativa de las vacas que producen menos de 2000 litro por lactancia Estimación por intervalo • Los estimadores puntuales son también variables aleatorias y, por lo tanto, no se puede esperar que en una realización cualquiera den un valor idéntico al parámetro que estiman. • Se desea que una estimación puntual esté acompañada de alguna medida del posible error de esa estimación. • Esto puede hacerse indicando el error estándar del estimador o dando un intervalo que incluya al verdadero valor del parámetro con un cierto nivel de confianza. Estimación por intervalo • El procedimiento que permite calcular los límites inferior y superior del intervalo antedicho se conoce como: Estimación por Intervalo y el intervalo obtenido: Intervalo de Confianza. • El objetivo del procedimiento de estimación por intervalo es encontrar el intervalo cerrado [LI, LS] donde LI = Límite Inferior y LS = Límite Superior, tal que si el parámetro a estimar se simboliza por θ, entonces: P(LI ≤ θ ≤ LS) = 1- α • Valores usuales de confianza son 0.95, 0.99 o 0.999 • Nota: Decir que un intervalo tiene confianza (1 – α)*100 significa que: “si se utiliza el mismo procedimiento de construcción del intervalo para m muestras aleatorias independientes de idéntico tamaño n, entonces m (1-α) intervalos contendrán al verdadero valor del parámetro”. Estimación por intervalos (Confianza). Resumen Ejemplo: • Si de una población con μ = 28, se toman 200 muestras independientes (m = 200) de tamaño “n” y se construyen para cada una un intervalo de confianza con coeficiente 0.90 (o del 90%), entonces se debe “esperar” que 180 de los 200 intervalos incluyan al valor 28. -Valores usuales de confianza son 0.95, 0.99 o 0.999 -Para poder construir estos intervalos se necesita: Una función continua que relacione el parámetros y su estimador y que tenga una función de distribución La curva normal estándar Estimación de la esperanza de una variable aleatoria normal • Se deben distinguir dos casos dependiendo de si σ2 es o no conocida. • Si σ2 es conocida • (x - m ) / s 2 / n ~ N (0,1) , se trabaja con una Normal estándar. • Para trabajar por intervalos si σ2 es conocida se usa: 2 Ejemplo práctico: cuando σ es conocida • Considerar la variable rendimiento de maíz, cuya distribución es normal con media μ y desviación estándar σ. Para estimar el rendimiento promedio del maíz bajo el efecto de un herbicida, se toma una muestra de tamaño 40 y se obtiene un promedio de 60 qq/ha. Se sabe por experiencias anteriores que la varianza poblacional σ2 es 25 (qq/ha)2. • a) Construir los intervalos de confianza del 95% y 99% para μ. • b) ¿Cómo cambia el intervalo anterior (95%) si el tamaño de la muestra fuese 100 y se obtiene el mismo promedio? • c) ¿Cómo se modifica el intervalo del 95% calculado en a) si la desviación estándar fuese de 7 qq/ha.? Recuerden buscar en la tabla Z Si no se conoce σ2 • Generalmente la varianza de la distribución es desconocida, por lo tanto el caso anterior no siempre se aplica y quedará modificado en esos casos como: g(m, x )) = (x - m ) / S 2 / n ~ T(n-1) • Donde (n-1), son los grados de libertad que caracterizan esta distribución. • Si se establece una confianza de (1-0.05)*100=95% y un tamaño muestral de por ejemplo n = 20, entonces, los cuantiles inferior y superior de una distribución T con (20 - 1) grados de libertad (g.l.) son: q1 = T α/2 = - 2.09 y q2 = T1-α/2 = 2.09, respectivamente. Así: Curva T-Student • Se usa para tamaños de muestra pequeñas y cuando se desconoce la Desviación estandar de la población • La curva tiene forma de campana con centro en 0. • Cada curva t es más dispersa que la normal estandar. • A medida que k tiende a infinito, la secuencia de curvas t, se aproxima a la curva normal estándar. • Cuando la desviación estandar del estadístico, se estima a partir de datos, el resultado se llama error estándar y se calcula como: Curva Normal y T de Student Ejemplo práctico • Se desea establecer el contenido vitamínico de un alimento balanceado para pollos. Se toma una muestra de 49 bolsas y se encuentra que el contenido promedio de vitaminas por cada 100 grs. es de 12 mg. y que la desviación estándar es de 2 mg. Encontrar el intervalo de confianza del 95% para el verdadero promedio del contenido de vitaminas. ¿Que piensan? Ejercicio • Una empresa dedicada a la comercialización de semillas desea estimar la altura promedio de un sorgo forrajero que ha desarrollado. Para ello toma una muestra de 50 plantas y se calcula la media de la altura, la que resulta ser 130 cm. Se sabe por experiencias anteriores que la desviación estándar es 22 cm. Construir los intervalos de confianza para μ con una confianza del 95 % y 99 % respectivamente. Comparar ambos intervalos y concluir. Ejercicio • La distribución del rendimiento por ha. de una variedad de trigo en la zona de Leones tiene una media μ = 24.5 qq/ha. y una desviación estándar de 5 qq/ha. Se extraen 5 muestras de tamaño 100 cada uno, obteniendo las siguientes medias: X1 = 24.1 X2 = 25.5 X3 = 23 X4 = 24 X5 = 25.9 • a) Construir los intervalos de confianza del 95% para la media poblacional para cada uno de estos valores. • b) Considerar las cinco muestras como una única (de tamaño 500) y recalcular la media de esta muestra mayor ( X ) y el intervalo de confianza correspondiente. • c) ¿Se observa alguna diferencia entre la amplitud de los intervalos de las muestras individuales respecto de la amplitud del intervalo construido con la muestra mayor?