Download Intervalos de Confianza
Document related concepts
Transcript
Intervalos de Confianza Una muestra: El caso de una media • En la teoría de Probabilidad se supone que se conocen todos los parámetros de una distribución de probabilidad, que en la estadística ocurre lo contrario. • El problema central en la estadística es usar los datos experimentales de observación para realizar inferencias acerca de los parámetros que son desconocidos a priori. • A los estadísticos utilizados para estimar valores de un parámetro desconocido, por ejemplo llámesele q, se le denomina un estimador de q. Al valor observado para el estimador se le llama el estimado. Por ejemplo: si se tiene una muestra de 5 datos, con los datos: X1= 3, X2= 5, X3=6, X4=4, X5=3, el estimado de la media poblacional para la población de donde proviene los datos se obtiene del estimador • Así la media muestral es un estimador de la media poblacional m. Claro que no se puede esperar que la media muestral sea exactamente igual a la media poblacional m, solamente se podrá esperar que esta cercana a su valor. • Es por esta “limitación” que en muchas ocasiones resulta más valioso dar un intervalo dentro del cuál se tenga una alta confianza de que la media m esta incluida. • Por ello a continuación se inicia el tema de la estimación por intervalos. Estimación puntual y por intervalos • Como se dijo, la intención es brindar un intervalo del que se tenga cierto grado de confianza de que m este dentro de él. Para obtener un estimador del intervalo se utiliza la distribución de probabilidad del estimador puntual. Así, para el caso del estimador puntual, cuya distribución de probabilidad es normal con media m y varianza s2/n se tiene que: z xm s n • Es el estadístico normal estándar que tiene una distribución normal con media 0 y varianza 1. De la curva de la distribución normal estándar se puede ver que: xm P z 0.025 z z 0.975 0.95 s n probabilidad Distribución Normal Estandar cuantiles normales (z) xm xm P z / 2 z n z / 2 1 s s n s s P z / 2 x m z / 2 1 n n • Al multiplicar a ambos lados por –1 se obtiene una expresión equivalente y cambiar el sentido de la desigualdad, se despeja m: s s P x z / 2 n m x z / 2 • Por ejemplo si asumimos = 0.05 s s P x 1.96 m x 1.96 0.95 n n 1 n • Esta última expresión define que el 95% de las veces m estará a no más de 1.96s/n unidades de la media muestral. De esta expresión se obtiene el intervalo del confianza del 95% para m. • Nótese que el intervalo anterior requiere el conocimiento de la varianza s2 lo cual en la práctica es difícil de que suceda. Definición • Si es la media muestral de una muestra aleatoria de tamaño n de una población con varianza conocida s2 , un intervalo de confianza para m del 100(1-)% esta dado por: x z s 2 n m x z s 2 n z /2 es el punto de la distribución normal estándar que corresponde al área de probabilidad /2. • Este intervalo brinda buenos resultados principalmente para muestras tomadas de una población cuya distribución de probabilidad es normal, o bien, para muestras de tamaño n >= 30. Para el caso de muestras pequeñas tomadas de poblaciones cuya distribución no sea normal no se puede esperar un buen resultado de la aplicación del mismo. Ejemplo 1: • Suponga que se reciben 35 bolsas de café, el contenido promedio de las mismas es 348 gramos. • Calcular los intervalos 95% y 99% para el contenido medio de café de estas bolsas. Asumir que la desviación estándar poblacional es de 8 gramos. Intervalo del 95% de nivel confianza: x = 348, s= 8 95% nivel de confianza, esto es =0.05: z /2, esto es z0.05/2 , z 0.025 = 1.96: 348 1.96 8 m 348 1.96 35 345.35 m 350.65 8 35 Intervalo 99% nivel de confianza: 99% nivel de confianza, esto es =0.01: z /2= 348 2.575 8 m 348 2.575 35 344.52 m 351.48 8 35 • Nótese como el intervalo del 99% de nivel de confianza ofrece mayor confianza pero al ser más amplio el intervalo que brinda puede ser de menor utilidad. • Entre más amplio sea el intervalo de confianza más confianza se puede tener de que contenga al parámetro desconocido. • Sin embargo, en muchas ocasiones será preferible un intervalo del 95% de confianza de que la vida de un motor esta entre 3 y 7 años que tener un intervalo de confianza del 99% que diga que esta vida promedio esta entre 1 y 10 años. Intervalo de confianza unilateral • En algunas ocasiones se puede estar interesado en afirmar, con algún nivel de confianza, por ejemplo 95%, que m es por lo menos tan grande o por lo menos tan pequeño como algún valor determinado. • Para establecer este valor, se puede empezar por observar que si Z es una variable aleatoria normal estándar, entonces de la siguiente figura z z P ( Z < z ) = 1-, si se supone como 0.05 entonces se tendría 1- Con lo cual: P ( Z < 1.645 ) = 0.95 n P x m 1.645 0.95 s s P x 1.645 m 0.95 n Definición • Si es la media muestral de una muestra aleatoria de tamaño n de una población con varianza conocida s2, un intervalo de confianza para m del 100(1-)% unilateral inferior esta dado por: x z • Y el superior inferior por: m x z s n m s n • donde z es el punto de la distribución normal estándar que corresponde al área de probabilidad . Ejemplo 2: Determinar los estimados de intervalo de confianza inferior y superior del 95% para el ejemplo 1. x 348, s= 8 • Intervalo inferior 95% nivel de confianza, con z , esto es z 0.05 = 1.645 x z s n m 348 1.645 * 345.78 m 8 35 m • Intervalo superior 95% nivel de confianza, con z , esto es z 0.05 = 1.645 m x z m 348 1.645 * 8 35 s n m 350.22 Tamaño de muestra • En ocasiones es necesario conocer que tan grande debe ser la muestra para poder hacer una afirmación del intervalo de confianza para la media. • Por ejemplo, suponga que por experiencia se sabe que el peso de las tilapias criadas en una planta se comporta de manera normal, con una desviación estándar constante de 0.4 kilogramos. Si se requiere tener un 95% de confianza de que el estimado del peso promedio de las tilapias sea correcto, un intervalo que realmente contenga a m, dentro de un límite, suponer de +/- 0.01 kilogramos ¿Cuántas tilapias se deberán recolectar? • De acuerdo con la ecuación del intervalo de confianza anterior, el valor estimado no dista más del calculado que los límites del intervalo, además hay que recordar que solamente se aproxima m, pero no necesariamente se va a coincidir con el valor real, va a estar cerca, pero ser un poco más grande o pequeño, como se muestra en la siguiente figura: m? x z s 2 n m? x m? x z s 2 n • Del intervalo de confianza es posible tener seguridad de que no estará a mas de cierto error ( ± cierto error) de m siempre puesto que: z s 2 n error • Para el ejemplo el error solicitado fue de 0.01, por lo que: s z 0.01 2 n 1.96 0.4 n 0.01 n 78.4 • Se requieren por lo menos 6147 tilapias para hacer el estudio y obtener un error tan pequeño como 0.01 de la estimación de la media m. • En general se especifica que n debe ser al menos z / 2s n E 2 Cuando se desconoce s2 • Si el tamaño de muestra es grande, n ≥ 30 se puede utilizar s como aproximación de s, aún cuando la normalidad no se pueda suponer. Esto por cuanto más buena será la aproximación entre más datos se tenga. • De lo contrario se puede recurrir a la variable aleatoria T que tiene una distribución t de Student con v = n-1 grados de libertad. xm T s n t t /2 xm P t t t 1 2 2 s n s s P t x m t 1 2 n 2 n • Al multiplicar * -1 y despejar m s s P x t m x t 1 2 2 n n • Esta última expresión define el intervalo de confianza para una media para el caso cuando se desconoce la varianza y la muestra es pequeña. Definición • Si es la media muestral de una muestra aleatoria de tamaño n de una población con varianza desconocida s2, un intervalo de confianza para m del 100(1-) % esta dado por: x t s 2 n m x t s 2 n • t /2 es el punto de la distribución t-student que corresponde al área de probabilidad /2. Ejemplo Intervalo unilateral • Se maneja al igual que para el caso del intervalo de confianza de una media con varianza conocida, el cambio radica en que ya sea intervalo superior o inferior se toma el estadístico t - student con y no /2 área de probabilidad Tamaño de muestra • Para determinar el tamaño de muestra requerido para establecer el intervalo, se procede al igual que se hizo con el caso del intervalo de confianza de una media con varianza conocida.