Download Clase 11 IC para la estimación de la media - U
Document related concepts
Transcript
Sesión 11 Intervalo de Confianza para la estimación de la media Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Media de una población normalmente distribuida con varianza desconocida • En la mayoría de las situaciones será difícil conocer la varianza de una población. • En este contexto “se presenta el problema de sustituir los valores numéricos de la varianza cuando se desea obtener un IC para la media” (Daniel, 1988, pag 151). • La desviación típica de la muestra se utiliza para estimar la desviación poblacional sigma. • Ello implica que en vez de trabajar con Z se debe utilizar la distribución t de student con n-1 grados de libertad. Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Media de una población normalmente distribuida con varianza desconocida S0 S0 I .C X 0 − t α ⋅ ≤ µ ≤ X0 + t α ⋅ = 1−α 1− ; n −1 1− ; n −1 n n 2 2 • Este es el IC para la media con una probabilidad de 1 – alfa • El valor t teórico se obtiene de la tabla. • S0 indica la desviación típica de la muestra escogida. Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Ejercicio 1: Uso de la Tabla t Determine los valores t teóricos cuando: • • • • • • Tamaño muestral (n) = 2; Nivel de confianza de 95%. Tamaño muestral (n) = 2; Nivel de confianza de 99%. N = 31, Nivel de confianza de 95%. n = 31; Nivel de confianza de 99%. n = 100; Nivel de confianza de 95%. n = 100; Nivel de confianza de 99%. • N= ∞ ; Nivel de confianza de 95%. Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Ejercicio 2: IC para la estimación de la media • Se desea establecer el tiempo promedio de respuesta de los jóvenes universitarios ante un estímulo visual. • Con dicho fin se evalúa a 25 alumnos de la carrera. • El tiempo medio de los jóvenes fue de 160 milisegundos • La desviación típica alcanzó los 5 milisegundos. • Actividad: Construya el I.C. para la media con un nivel de confianza del 99% •Valor t = 2.7969 •RESULTADO: Límites del IC: 157 - 163 Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Media de una población no distribuida normalmente • No siempre es posible asumir que la población a la que deseamos estimar sus parámetros se encuentra distribuida normalmente . • Hemos de conocer procedimientos de construcción de I.C para estimar parámetros de poblaciones no normales. • El desarrollar un muestreo en este tipo de población conduce a dos situaciones: (a) la muestra es pequeña (b) la muestra es grande. • ¡Recordar el teorema del límite central! • La distribución muestral de las medias no es normal cuando las muestras son pequeñas; por lo tanto, no se puede construir el I.C para la media con los procedimientos revisados hasta este momento. • “cuando las medias muestrales se calculan a partir de muestras grandes, el valor z se distribuye de forma aproximadamente normal con media 0 y varianza 1, sin importar la forma de la población de la muestra” (Daniel, 1988, pag. 153) Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Media de una población no distribuida normalmente • Si el muestreo se realiza sin reemplazamiento en una población finita, no normal, es posible utilizar el factor de corrección. σ I .C X 0 − Z α n 2 σ N −n ≤ µ ≤ X 0 + Zα N −1 n 2 N −n = 1 − α N −1 ¡Es inusual conocer las varianzas, más allá de la forma de la población! Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Media de una población no distribuida normalmente • Debido a ello, lo más común es estimar las varianzas poblacionales a partir de las varianzas muestrales. • Así, la fórmula definitiva es la siguiente: S0 I .C X 0 − Z α n 2 S0 N −n ≤ µ ≤ X 0 + Zα N −1 n 2 N −n = 1 − α N −1 En síntesis, se utiliza esta fórmula cuando no se conoce la forma funcional de la población ni su varianza, pero n es grande. • Nota: No olvidar que si n/N es menor o igual a 0.05 no es necesario adicionar el factor de corrección. Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Ejercicio 3: IC en poblaciones no normales • Se desea estimar el nivel de aptitud verbal que presentan personas condenadas por alguno de los delitos de mayor connotación social (DMCS). • De la población de 5500 condenados por DMCS se examina a una m.a.s de 500 personas y se les administra un test de 120 preguntas. • En promedio, contestan adecuadamente 65 ítems, con una desviación típica de 15 . • Realice la estimación del parámetro media mediante un I.C (con un nivel de confianza del 95%). • Considere que se desconocen mayores antecedentes sobre las características de la población en estudio. Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Ejercicio 3: IC en poblaciones no normales S I .C X 0 − Z α 0 n 2 15 I .C 65 − 1.96 500 S N −n ≤ µ ≤ X 0 + Zα 0 N −1 n 2 5500 − 500 15 ≤ µ ≤ 65 + 1.96 5500 − 1 500 N −n N −1 = 1 − α 5500 − 500 = 1 − α 5500 − 1 I .C ( 65 − 1.96 ⋅ 0.6708 ⋅ 0.9535 ≤ µ ≤ 65 + 1.96 ⋅ 0.6708 ⋅ 0.9535) = 1 − α I.C( 63.75 ≤ µ ≤ 66.25) =1−α Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Tamaño de la muestra con una población Infinita •Cuando surge una investigación resulta imprescindible cuestionarse sobre el tamaño de la muestra a incluir (y sobre como acceder a ella). •Una muestra pequeña puede producir resultados no generalizables a la población. •Por otra parte, una muestra excesivamente grande no garantiza representatividad, e implica gran consumo de recursos (humanos, temporales, económicos). Z α ⋅σ 1− 2 n = e 2 Z = 2 1− e Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro α 2 2 ⋅σ 2 Tamaño de la muestra con una población Infinita • Especificar el nivel de confianza que adoptará el IC no resulta problemático (usualmente es 95%). • El error (proximidad entre los límites del IC y la media verdadera de la población) también se fija arbitrariamente. • Lo complejo resulta estimar la varianza poblacional. ¿Qué soluciones existen? 1. Calcular la varianza en una muestra piloto. 2. Estimar la varianza a través de la revisión de antecedentes (estudios previos similares al nuestro). ¡El resultado debe ser un número entero! Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Ejercicio 4: Tamaño de la muestra con una población Infinita • Volviendo al ejemplo de Tiempo de reacción ante un estímulo. • Un investigador desea conocer cuantos sujetos debe evaluar para determinar la media verdadera con un 95% de confianza • ¿¿Alfa?? ¿¿1-alfa?. • El investigador no desea tener un error mayor a 0.10 segundos de la media real del grupo. • En una muestra piloto, se determinó que la Desviación estándar es igual a 0.3 segundos. •¿Qué tamaño debe tener la muestra que necesita el investigador? 1.962 ⋅ 0.32 n= 2 0.10 Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Tamaño de la muestra con una población Finita • ¿En qué casos ud. podría conocer el tamaño de la población? • Ejs: Colegio, Universidad, Empresa, Pacientes en un período de tiempo. • En estos casos, se debe agregar el Factor de corrección para la Población Finita. N ⋅Z n= 2 1− α ⋅σ 2 2 2 Z 2 ⋅ σ 2 + d ( N − 1) Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro Ejercicio 5: Tamaño de la muestra con una población Finita • Un Psicólogo educacional trabaja en una escuela con 2500 estudiantes. • Desea determinar el tiempo que tardarían en contestar un test que evalúa función ejecutiva (Ejemplo: Test de Stroop). • El error en la estimación se establece en 1 minuto. • Se debe integrar el Factor de corrección para la Población Finita. • Realice la estimación de la muestra con un IC del 99% y del 95%. N ⋅ Z2 2 ⋅ σ α 2 2 2500 ⋅ 2.58 ⋅5 2 n= 2 2 2 = =156.08 ≈157 2 2 2 Z ⋅σ + d (N −1) (2.58 ⋅ 5 ) +1 ⋅ (2500 −1) 1− Estadística II Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro