Download 5-Estimación estadística

Document related concepts

Estimador wikipedia , lookup

Estimación estadística wikipedia , lookup

Intervalo de confianza wikipedia , lookup

Error estándar wikipedia , lookup

Error cuadrático medio wikipedia , lookup

Transcript
Estimación
estadística
Temas
•
•
•
•
Parámetro y estimador
Propiedades de un buen estimador
Estimación puntual (Ejemplo aplicado)
Estimación por intervalo (Ejemplo aplicado)
1 semana
Parámetro y estimador
• Un parámetro es una función definida sobre una variable que
caracteriza a una población (constante).
• Un estimador es un estadístico (una función de la muestra),
usado para estimar un parámetro desconocido de la
población.
• En general se utilizan los estimadores que tengan las mejores
propiedades.
• En el proceso de estimación de un parámetro hay dos
enfoques que responden a diferentes necesidades: la
estimación puntual y la estimación por intervalo de confianza.
Estimación puntual
• Cuando se aproxima un parámetro de una distribución a
través de un valor decimos que se está haciendo es una
estimación puntual
• Así, por ejemplo, la media muestral es una función de n
variables aleatorias donde “n” es el tamaño de la muestra.
• Para seleccionar un buen estimador entre un conjunto de
posibles estimadores, los estadísticos propuestos son
estudiados teniendo en cuenta ciertas propiedades deseables.
Propiedades de un buen
estimador
• La elección de un estimador se realiza teniendo en cuenta,
entre otros, los siguientes criterios:
• Insesgamiento: Un estimador insesgado es aquel en el que la
esperanza del estimador es igual al verdadero valor del
parámetro. El sesgo del es definido como: Sesgo(ˆθ )=E(ˆθ - θ
).
• Consistencia: A medida que aumenta el tamaño de la
muestra, el valor del estimador tiende a ser el valor del
parámetro.
^
E(q ) ® q
^
Var(q ) ® 0
Cuando n tiende a infinito
Propiedades de un buen
estimador
• Eficiencia: Se refiere a la precisión (Variación). Un estimador
es más eficiente que otro, si la varianza del primero es menor
que la del segundo.
• Robustez: Un estimador es Robusto si la violación de los
supuestos de la estimación (Distribución), no altera de manera
significativa los resultados.
• Suficiencia: No puede obtenerse información adicional acerca
del estado de la naturaleza, observando otros aspectos de a
muestra que no intervengan en el estadístico suficiente.
Ejemplo: La media muestral sería un estimador suficiente de la
media poblacional, mientras que la mediana no.
Estimadores
Exactitud y Precisión
Confiabilidad: Se refiere a la consistencia de los resultados. Se refiere a la
concordancia de los resultados en dos o más ocasiones diferentes.
Estimación Puntual
Ejercicio (Estimar).
Estimar la media, la desviación estandar y
la frecuencia relativa de las vacas que
producen menos de 2000 litro por lactancia
Estimación por intervalo
• Los estimadores puntuales son también variables aleatorias y,
por lo tanto, no se puede esperar que en una realización
cualquiera den un valor idéntico al parámetro que estiman.
• Se desea que una estimación puntual esté acompañada de
alguna medida del posible error de esa estimación.
• Esto puede hacerse indicando el error estándar del estimador
o dando un intervalo que incluya al verdadero valor del
parámetro con un cierto nivel de confianza.
Estimación por intervalo
• El procedimiento que permite calcular los límites inferior y
superior del intervalo antedicho se conoce como: Estimación
por Intervalo y el intervalo obtenido: Intervalo de Confianza.
• El objetivo del procedimiento de estimación por intervalo es
encontrar el intervalo cerrado [LI, LS] donde LI = Límite Inferior
y LS = Límite Superior, tal que si el parámetro a estimar se
simboliza por θ, entonces: P(LI ≤ θ ≤ LS) = 1- α
• Valores usuales de confianza son 0.95, 0.99 o 0.999
• Nota: Decir que un intervalo tiene confianza (1 – α)*100
significa que: “si se utiliza el mismo procedimiento de
construcción del intervalo para m muestras aleatorias
independientes de idéntico tamaño n, entonces m (1-α)
intervalos contendrán al verdadero valor del parámetro”.
Estimación por intervalos
(Confianza).
Resumen
Ejemplo:
• Si de una población con μ = 28, se toman 200 muestras
independientes (m = 200) de tamaño “n” y se construyen para
cada una un intervalo de confianza con coeficiente 0.90 (o del
90%), entonces se debe “esperar” que 180 de los 200
intervalos incluyan al valor 28.
-Valores usuales de confianza son 0.95, 0.99 o 0.999
-Para poder construir estos intervalos se necesita: Una función continua que
relacione el parámetros y su estimador y que tenga una función de distribución
La curva normal estándar
Estimación de la esperanza de
una variable aleatoria normal
• Se deben distinguir dos casos dependiendo de si σ2 es o no
conocida.
• Si σ2 es conocida
• (x - m ) / s 2 / n ~ N (0,1) , se trabaja con una Normal
estándar.
• Para trabajar por intervalos si σ2 es conocida se usa:
2
Ejemplo práctico: cuando σ es
conocida
• Considerar la variable rendimiento de maíz, cuya distribución
es normal con media μ y desviación estándar σ. Para estimar
el rendimiento promedio del maíz bajo el efecto de un
herbicida, se toma una muestra de tamaño 40 y se obtiene un
promedio de 60 qq/ha. Se sabe por experiencias anteriores
que la varianza poblacional σ2 es 25 (qq/ha)2.
• a) Construir los intervalos de confianza del 95% y 99% para μ.
• b) ¿Cómo cambia el intervalo anterior (95%) si el tamaño de la
muestra fuese 100 y se obtiene el mismo promedio?
• c) ¿Cómo se modifica el intervalo del 95% calculado en a) si la
desviación estándar fuese de 7 qq/ha.?
Recuerden buscar en la tabla Z
Si no se conoce σ2
• Generalmente la varianza de la distribución es desconocida,
por lo tanto el caso anterior no siempre se aplica y quedará
modificado en esos casos como:
g(m, x )) = (x - m ) / S 2 / n ~ T(n-1)
• Donde (n-1), son los grados de libertad que caracterizan esta
distribución.
• Si se establece una confianza de (1-0.05)*100=95% y un
tamaño muestral de por ejemplo n = 20, entonces, los
cuantiles inferior y superior de una distribución T con (20 - 1)
grados de libertad (g.l.) son: q1 = T α/2 = - 2.09 y q2 = T1-α/2 =
2.09, respectivamente. Así:
Curva T-Student
• Se usa para tamaños de muestra pequeñas y cuando se
desconoce la Desviación estandar de la población
• La curva tiene forma de campana con centro en 0.
• Cada curva t es más dispersa que la normal estandar.
• A medida que k tiende a infinito, la secuencia de curvas t, se
aproxima a la curva normal estándar.
• Cuando la desviación estandar del estadístico, se estima a
partir de datos, el resultado se llama error estándar y se
calcula como:
Curva Normal y T de Student
Ejemplo práctico
• Se desea establecer el contenido vitamínico de un
alimento balanceado para pollos. Se toma una muestra
de 49 bolsas y se encuentra que el contenido promedio
de vitaminas por cada 100 grs. es de 12 mg. y que la
desviación estándar es de 2 mg. Encontrar el intervalo de
confianza del 95% para el verdadero promedio del
contenido de vitaminas.
¿Que piensan?
Ejercicio
• Una empresa dedicada a la comercialización de semillas
desea estimar la altura promedio de un sorgo forrajero
que ha desarrollado. Para ello toma una muestra de 50
plantas y se calcula la media de la altura, la que resulta
ser 130 cm. Se sabe por experiencias anteriores que la
desviación estándar es 22 cm. Construir los intervalos de
confianza para μ con una confianza del 95 % y 99 %
respectivamente. Comparar ambos intervalos y concluir.
Ejercicio
• La distribución del rendimiento por ha. de una variedad de
trigo en la zona de Leones tiene una media μ = 24.5 qq/ha. y
una desviación estándar de 5 qq/ha. Se extraen 5 muestras de
tamaño 100 cada uno, obteniendo las siguientes medias:
X1 = 24.1 X2 = 25.5 X3 = 23 X4 = 24 X5 = 25.9
• a) Construir los intervalos de confianza del 95% para la media
poblacional para cada uno de estos valores.
• b) Considerar las cinco muestras como una única (de tamaño
500) y recalcular la media de esta muestra mayor ( X ) y el
intervalo de confianza correspondiente.
• c) ¿Se observa alguna diferencia entre la amplitud de los
intervalos de las muestras individuales respecto de la amplitud
del intervalo construido con la muestra mayor?