Download intervalos de confianza para la media poblacional. intervalos de
Document related concepts
Transcript
Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD LECTURA 04: INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL. INTERVALOS DE CONFIANZA ENTRE DOS MEDIAS POBLACIONALES. TEMA 8: INTERVALOS DE CONFIANZA: INTRODUCCIÓN Y DEFINICIÓN 1. INTRODUCCION: Actualmente se debe estar bien consciente de que las poblaciones son generalmente muy grandes como para ser estudiadas en su totalidad. Su tamaño requiere que se selecciones muestras las cuales se pueden utilizar para hacer inferencias sobre poblaciones. Hay dos tipos de estimadores que se utilizan más comúnmente para este propósito: un estimador puntual y un estimador por intervalo. Un estimador puntual utiliza un estadístico para estimar el parámetro en un solo valor o punto. El estimador puntual por ser un solo numero, no proporciona por si mismo información alguna sobre la precisión y confiabilidad de la estimación. Debido a la variabilidad de la muestra, nunca se tendrá que x = µ . El estimado puntual nada dice sobre lo cercano que esta de µ . El Psicologo puede seleccionar una muestra de n=50 pacientes y hallar la edad promedio de x = 36 , este valor sirve como estimación puntual para la media poblacional. Una alternativa para reportar un solo valor del parámetro que se esta estimando es calcular e informar todo un intervalo de valores factibles, un intervalo de confianza. Una estimación por intervalo especifica el rango dentro del cual está el parámetro poblacional desconocido. El Psicologo puede decidir que la media poblacional esté entre 35 y 38. Tal intervalo con frecuencia va acompañado de una afirmación sobre el nivel de confianza que se da con exactitud. Por lo tanto se llama intervalo de confianza. En realidad hay tres niveles relacionados comúnmente con los intervalos de confianza: 99%, 95% y 90%. El Psicologo mencionado puede tener un 95% de confianza en que la media poblacional está entre 35 y 38. ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 1 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD 2. DEFINICIÓN: Es el rango dentro del cual se encuentra el parámetro desconocido θ con un nivel de confianza dado. En base a una muestra aleatoria y la correspondiente estadística θ̂ , se trata de encontrar un intervalo [L 1, L2] llamado Intervalo de Confianza que debe contener el parámetro θ con una probabilidad dada (1-α) llamado nivel de confianza. Si θ̂ es una estadística f( θ̂ ) 1-α α/2 α/2 L1 θ. 1 L2 fig. 11 El intervalo [L1, L2] es un intervalo aleatorio ya que sus extremos L 1, L2 llamados límites de confianza son variables cuyos valores varían de una muestra a otra. La Estimación Interválica consiste en calcular L 1, L2 dada una muestra aleatoria y un nivel de confianza (1-α) y decir que se tiene confianza del 100 (1-α) % que el intervalo contiene el valor desconocido θ. Por ejemplo: Si 1-α = 0.95, se dice que se tiene una confianza del 95% que el intervalo contenga el valor desconocido θ; o bien, de 100 intervalos aleatorios que se tomen 95 de las veces contendrá el parámetro y sólo 5 veces no lo contendrá. ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 2 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD TEMA 09: INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL HACIENDO USO DE LA ESTADISTICA Z Y T. 1. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL P[ L 1 ≤ µ ≤ L 2 ] = 1 − α 1-α α/2 μ L1 α/2 L2 fig. 12 Se presentan los siguientes casos: 1.1. CASO I: Uso de la Estadística Z. i) Muestra grande (n ≥ 30), varianza poblacional conocida σ2 y población normal o no. ii) L1 = x − Z 0 × σ x L 2 = x + Z0 × σ x ( ) 2 2 Muestra grande (n ≥ 30), varianza poblacional desconocida σ ≅ s y población normal o no. L1 = x − Z 0 × s x L 2 = x + Z0 × s x ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 3 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD Muestra pequeña (n < 30), varianza poblacional conocida σ normal. iii) 1.2. L1 = x − Z 0 × σ x L 2 = x + Z0 × σ x 2 CASO II: Uso de la Estadística t. Muestra pequeña (n < 30), varianza poblacional desconocida y población (σ 2 ≅ s2 ) y población normal. L1 = x − t 0 × s x L 21 = x + t 0 × s x Donde: t 0 = t 1− α / 2 , n -1 2. ERROR ESTÁNDAR DE LA MEDIA El error estándar es una medida de la dispersión de las medias de muestras alrededor de la media de la población. Si la dispersión disminuye (si σ se hace más pequeña), entonces los valores tomados por la media de la muestra tienden a agruparse mas cercanamente alrededor de µ . Y a la inversa, si la dispersión se incrementa (si σ se agranda), los valores tomados por la media de la muestra tienden a agruparse menos cercanamente alrededor de µ . Al disminuir el error estándar, el valor de cualquier media de muestra probablemente se acercara al valor de la población, lo que quiere decir que al disminuir el error estándar, se incrementa la precisión con que se puede usar la media de la muestra para estimar la media de la población. • Si el muestreo es con o sin reposición en una población infinita (o con sustitución en una población finita de tamaño N), el error estándar de la media muestral es: σ → (σ 2 conocida ) i) σ x = n ii) sx = s → (σ 2 desconocida ) n ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 4 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD • Si el muestreo es sin reposición en una población finita de tamaño N, el error estándar de la media muestra es: = σ × n N− n → (σ 2 conocida ) N− 1 ii) s x = s × n N− n → (σ 2 desconocida ) N− 1 i) σ x Donde: N− n es el factor de corrección para población finita. N− 1 NOTA: Generalmente se utiliza el muestreo sin reposición en poblaciones infinitas y finitas de tamaño N Ejemplo 1: Se ha llevado acabo una prueba para determinar el coeficiente intelectual medio de los alumnos, sabiendo que el coeficiente intelectual sigue una distribución normal con desviación estándar 24 . De una muestra de 100 alumnos se obtiene un un coeficiente intlectual medio de 90 soles. Calcular un intervalo de confianza del 95% para el coeficiente intelectual medio poblacional tomando en cuenta que el coeficiente normal varía de 80 a 120. Solución: a) Se desea estimar: μ: Coeficiente intelectual medio poblacional b) Análisis: • n = 100 • n=100 (n>30) • σ = 24 soles x = 90 • Varianza poblacional conocida y población normal. • Para un nivel de confianza 1 – α = 0.95 ZO = 1.96 • Error estándar de la media muestral x es: σ 24 σx = = = 2.4 n 100 ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 5 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD c) Haremos uso de la estadística Z descrita en el Caso I – i: d) Hallando el intervalo de confianza: σ L1 = x − Z0 × = 90 − 1.96 × 2.4 = 85.30 n σ L 2 = x + Z0 × = 90 + 1.96 × 2.4 = 94.70 n e) Interpretación: El coeficiente medio intelectual poblacional de los alumnos varia entre 85.30y 94.70 con una confianza del 95%. Ejemplo 2: Un Psicologo hace un estudio sobre el número de comportamientos agresivos a la semana en una muestra aleatoria de 9 monos de una determinada zona obtiene una media media muestral de 11 agresiones, considerando que la poblaciòn es normal con varianza 12 . Obtener un intervalo de confianza del 90% para el número medio de comportamientos agresivos real. Solución: a) Se desea estimar: μ: Número medio de comportamientos agresivos. b) Análisis: x = 11 • n=9 • n=9 (n<30) ( 2 • Varianza poblacional conocida σ = 12 ) • Para el nivel de confianza 1 – α = 0.90 ZO = 1.645 • Error estándar de la media muestral x : sx = σ 3.4641 = = 1.1547 n 9 c) Haremos uso de la estadística Z descrita en el Caso I - iii d) Hallando el intervalo de confianza: ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 6 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD L1 = x − Z0 × σ = 11 − 1.645 × 1.1547 = 9.1005 ≅ 9 n L 2 = x + Z0 × σ = 11 + 1.645 × 1.1547 = 12.90 ≅ 13 n e) Interpretación: Con una confianza del 95% que el número medio de comportamientos agresivos real de los monos varía entre 9 y 13. Ejemplo 3: Un investigador desea estimar el contenido promedio de alquitrán de cierta marca de 4 cigarrillos para ello toma una muestra de 25 cigarrillos obteniendo una media de 17.2 mg. y una desviación estándar de 5 mg.; estudios anteriores indican que el contenido de alquitran se distribuye normalmente. Estime un intervalo de confianza del 99% para el contenido promedio de alquitrán poblacional. Solución: a) Se desea estimar: μ: Contenido promedio de alquitrán b) Análisis: x = 17.2 mg. • n=25 s = 5 mg. • n=25 (n<30) • Varianza poblacional desconocida σ • • • ( 2 ) ≅ s 2 se estima a través de la muestra. Población normal. t O = t 0.995,24 = 2.797 Para el nivel de confianza 1 – α = 0.99 El error estándar de la media muestral x es: sx = s = n 5 =1 25 ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 7 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD c) Haremos uso de la estadística t: d) Hallando el intervalo de confianza: s L1 = x − t 0 × = 17 − 2.797 × 1 = 14.20 mg. n s L2 = x + t 0 × = 17 + 2.797 × 1 = 19.20 mg. n e) Interpretación: El contendio promedio de nicotina poblacional varia ente 14.21 mg. Y 19.20 mg. Ejemplo 4: Los siguientes datos son los puntajes obtenidos para para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). 2 5 6 8 8 9 9 10 11 11 11 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19 19 19 19 19 19 19 19 20 20 Sabiendo que la población es normal de tamaño N=500. Calcular un intervalo de confianza del 95% para la escala promedio poblacional Solución: a) Se desea estimar: μ: Escala promedio de depresión poblacional b) Análisis: x = 14.5556 • n=45 s = 4.2768 ( • Varianza poblacional desconocida σ • Población normal. 2 ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 ) ≅ s2 . 8 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD • Se tiene una población finita de tamaño N=500, entonces El error estándar de la media muestral x es: sx = s × n N − n 4.2768 = × N− 1 45 500 − 45 = 1.1932 500 − 1 c) Haremos uso de la estadística Z descrita en el Caso I - ii: d) Hallando el intervalo de confianza: L1 = x − Z0 × s × n N− n N− 1 L 2 = x + Z0 × s × n N− n N− 1 L1 = 14.5556 − 1.96 × 1.1932 L 2 = 14.5556 + 1.96 × 1.1932 L1 = 12.22 L 2 = 16.89 e) Interpretación: La escala de depresión promedio poblacional varía entre 12.22 y 16.89 con un nivel de confianza del 95%. ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 9 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD TEMA 10: INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES HACIENDO USO DE LA ESTADISTICA Z Y T. 1. INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES P [ L1 ≤ µ 1 − µ 2 ≤ L 2 ] = 1 − α 1-α α /2 L1 µ1− µ2 α /2 L2 fig. 13 Se presentan los siguientes casos: 1.1. i) CASO I: Uso de la Estadística Z. Muestras grandes n1 ≥ 30 y n 2 ≥ , 30 varianzas poblacionales conocidas σ 12 y σ 22 poblaciónes normal o no. L1 = (x1 − x 2 ) − Z 0 × σ x1 − x 2 L 2 = (x1 − x 2 ) + Z 0 × σ x1 − x 2 Donde: σ x1 − x 2 = σ 12 σ 22 + n1 n 2 ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 10 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD ii) Muestras grandes n1 ≥ 30 y n 2 ≥ 30 , varianzas poblacionales desconocidas (σ 12 ≅ s12 y σ 22 ≅ s 22 ) y poblaciónes normales o no. L1 = (x1 − x 2 ) − Z 0 × s x1 − x 2 L 2 = (x1 − x 2 ) + Z0 × s x1 − x 2 Donde: s x1 − x 2 = s12 s 22 + n1 n 2 iii) Muestras pequeñas n1 < 30 y n 2 < 30 considerando que (n1+n2<30) , varianzas σ 12 y σ 22 poblacionales conocidas y poblaciónes normales. L1 = (x1 − x 2 ) − Z0 × σ x1 − x 2 L 2 = (x1 − x 2 ) + Z 0 × σ x1 − x 2 Donde: σ x1 − x 2 = σ 12 σ 22 + n1 n 2 NOTA: En caso de que las poblaciones N 1 y N2 fueran finitas se debe corregir el intervalo a través del error estándar de la diferencia de medias muestrales tal como se presenta a continuaciòn: ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 11 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD σ x1 − x 2 = σ 12 N1 − n1 σ 22 N 2 − n 2 + n1 N1 − 1 n 2 N 2 − 1 s x1 − x 2 = s12 N1 − n1 s 22 N 2 − n 2 + n1 N1 − 1 n 2 N 2 − 1 1.2. CASO II: Uso de la Estadística t. i) Muestras pequeñas n1 < 30 y n 2 < 30 consdierando que ( n1+n2<30), varianzas 2 2 2 2 2 2 poblacionales desconocidas pero iguales σ 1 = σ 2 (σ 1 ≅ s1 y σ 2 ≅ s 2 ) y poblaciónes normales. L1 = (x1 − x 2 ) − t 0 × s C 1 1 + n1 n 2 L 2 = (x1 − x 2 ) + t 0 × s C 1 1 + n1 n 2 Donde: s x1 − x 2 = s C sc = 1 1 + n1 n 2 (n1 − 1) × s12 + (n 2 − 1) × s 22 n1 + n 2 − 2 Además: t 0 = t1− α / 2, n1 +n 2 -2 ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 12 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD ii) Muestras pequeñas n1 < 30 y n 2 < 30 considirando que ( n1+n2<30), 2 2 2 2 2 2 varianzas poblacionales desconocidas pero diferentes σ 1 ≠ σ 2 (σ 1 ≅ s1 y σ 2 ≅ s 2 ) y poblaciónes normales. L1 = (x1 − x 2 ) − t 0 s12 s 22 + n1 n 2 L 2 = (x1 − x 2 ) + t 0 s12 s 22 + n1 n 2 Donde: t 0 = t1− α / 2, r s12 + n1 r= 2 s12 n1 + n1 − 1 s 22 n 2 s22 n 2 n2 − 1 2 Ejercicio 1: La tasa de consumo de oxígeno es una medida de la actividad fisiológica de los corredores. Se desea comparar las tasas de consumo de oxigeno en ml./minuto en corredores de entrenamiento por dos métodos distintos: un entrenamiento continuo durante cierto lapaso de tiempo cada dìa, y un entrenamiento intermitente con la misma duración total. Se han tomado datos del consumo de oxígeno de varones universitarios entrenados por ambos métodos y se han obtenido los siguientes descriptivos: ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 13 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD Entrenamiento continuo Entrenamiento intermitente n1=9 n2=7 x1 = 43.71 x 2 = 39.63 s12 = 5.88 s 22 = 7.68 Si se supone que las mediciones provienen de poblaciones normales independientes con igual varianza, estime la diferencia real de tasas medias de consumo de oxígeno con un nivel de confianza del 95%. Solución: a) Se desea estimar: µ 1 − µ 2 : La diferencia real de tasas medias de consumo de oxígeno. b) Análisis: x = 43.71ml./ min uto • n=9 s = 2.42 ml./ min uto x = 39.63ml./ min uto • n=7 s = 2.77 ml./ min uto n1 = 9 < 30 y n 2 = 7 < 30 • • Varianzas poblaciones iguales pero desconocidas σ 12 ≠ σ 22 normales. ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 14 y poblaciones Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD • Hacemos uso de la estadística t Caso II i) con un nivel de confianza del 95%, entonces • t 0 = t1− α / 2, n1 +n 2 -2 = t 0.975, 14 =2.145 Error estándar de la diferencia de medias es: s x1 − x 2 = s C sc = 1 1 + n1 n 2 (9 − 1) × 5.88 + (7 − 1) × 7.68 9+ 7− 2 s c = 2.58 s x1 − x 2 = 2.58 1 1 + 9 7 s x1 − x 2 = 1.3 Entonces: L1 = (x1 − x 2 ) − t 0 × s C 1 1 + n1 n 2 L1 = (43.71 − 39.63) − 2.145 × 1.3 L1 = 7.68 − 2.79 L1 = 4.89 ml. / min uto ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 15 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD L 2 = (x1 − x 2 ) + t 0 × s C 1 1 + n1 n 2 L 2 = (43.71 − 39.63) − 2.145 × 1.3 L 2 = 7.68 + 2.79 L 2 = 10.47ml./ min uto Se tiene una confianza del 95% de que las diferencias medias de las tasas medias de consumo de oxigeno varía entre 4.89ml./minuto y 10.47 ml./ minuto. Ejemplo 2: El nivel de colesterol es un factor de alto riesgo en el desarrollo de la enfermedad de artereoesclerosis cardiaca y de la enfermedad de arteria coronaria, por tanto, es importante determinar los niveles que esperamos en los diferentes grupos de edad y sexo. Para comparar el nivel de colesterol de los varones de 20 a 29 años de edad frente a las mujeres del mismo grupo, se realizó un estudio cuyos resultados se exponen a continuación: • Hombres Mujeres n1=96 n2=85 x1 = 180.81mg./ dl x1 = 181.08 mg./ dl s1 = 30.55 mg./ dl s 2 = 30.59mg./ dl Obtener un intervalo de confianza para la diferencia de medias del nivel de colesterol de hombres y mujeres al 90%. ¿Son los niveles de colesterol diferentes? ¿Quién tiene un nivel más alto de colesterol los hombres o las mujeres? ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 16 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD Solución: a) Se desea estimar: µ 1 − µ 2 : La diferencia media poblacional del nivel de colesterol de hombres y mujeres. b) Análisis: x1 = 180.81 • n=9 6 s1 = 30.55 x1 = 181.08 • n=85 s 2 = 30.59 n1 = 96 > 30 y n 2 = 85 > 30 • • • 2 2 Varianzas poblaciones desconocidas (s1 = 933.3025 y s 2 = 935.7481) y poblaciones normales por el Teorema de Limite Central n1 ≥ 30 y n 2 ≥ 30 Hacemos uso de la estadística Z Caso I ii) con un nivel de confianza del 90%, entonces • z 0 = 1.645 Error estándar de la diferencia de medias es: s x1 − x 2 = s12 s 22 + n1 n 2 ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 17 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD s x1 − x 2 = 933.3025 935.7481 + 96 85 s x1 − x 2 = 4.5531 Entonces: L1 = (x1 − x 2 ) − Z0 × s x1 − x 2 L 2 = (x1 − x 2 ) + Z0 × s x1 − x 2 L1 = (x1 − x 2 ) − Z0 × s x1 − x 2 L1 = (180.81 − 181.08) − 1.645 × 4.5531 L1 = − 0.27 − 7.49 L1 = − 7.76 L 2 = (x1 − x 2 ) + Z 0 × s x1 − x 2 L 2 = (180.81 − 181.08) + 1.645 × 4.5531 L 2 = − 0.27 + 7.49 L 2 = 7.22 • Se tiene una confianza del 90% de que las diferencia media poblacional del nivel de colesterol varía entre 0 mg./dl y 7.22 mg./dl. ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 18 Universidad Los Ángeles de Chimbote CURSO BIOESTADÍSTICA FACULTAD DE CIENCIAS DE LA SALUD • En el resultado observamos que el valor cero se encuentra dentro del intervalo, entonces los niveles de colesterol de los hombres y de las mujeres son iguales. ____________________________________________ Elaborado por Fecha Versión : Mg. Carmen Barreto R. : Marzo 2011 :2 19