Download Estadística de prueba - Departamento de Matemática Aplicada y
Document related concepts
Transcript
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas Curso de Elementos de Estadística Prof. María Pilar Sánchez Clase Nº10: Pruebas para una y dos muestras. Otoño, 2003 Pruebas de hipótesis para la media de una población • Cuando se quiere estudiar la hipótesis de una media de una población hay tres posibilidades: a.- En una población normal con varianza conocida. b.- En una población normal con varianza desconocida. c.- En una población que no presenta distribución normal. • Es posible según algunos autores aplicar la teoría aún cuando las poblaciones sólo estén distribuídas en forma normal siempre y cuando la desviación de la normalidad sea moderada. Ejemplo 1: Muestreo en población normal y varianza conocida. Cuando se extraen datos de una población normal con varianza conocida la estadística de prueba es: x 0 z / n Ej:Una profesora está interesada en conocer la edad media de una cierta población y se pregunta si la población media de esa población es diferente de 30 años. Para ello dispone de una muestra aleatoria simple de 10 alumnos que se extrajo de la población de interés. La media de la muestra fue de 27 años y se conoce que la varianza de la población es de 20. • Datos: x 27, • Suposiciones: 20 , 30, n 10 La muestra proviene de una distribución normal. Ejemplo 1: continuación… • Hipótesis: H o : μ 30 y H a : μ 30 • Distribución de la estadística de prueba: se sabe • • que tiene distribución normal con media=0 y varianza de 1. Regla de decisión: Ho se rechaza si zcalc cae en la zona de rechazo, utilizando =0.05 (error de tipo I) que está dividida en dos partes iguales (/2=0.025). Valor crítico de la estadística de prueba: Se busca en la tabla z, y nos preguntamos que valor de z tiene una probabilidad igual a 0.025 y es valor es 1.96. Ejemplo 1: continuación… • Cálculo de la estadística de prueba: 27 30 3 z 2.12 20 / 10 1.4142 • Decisión estadística: Se puede rechazar Ho • • porque -2.12 está en la región de rechazo con un nivel de significación de =0.05. Conclusión: Se concluye que no igual a 30. Valor de p: Busco en la tabla que valor de probabilidad tiene -2.12 y da 0.017 y en ejemplo debemos sumar dos veces por las dos colas y se dice que la hipótesis se rechaza con un valor de p igual a 0.0340. Ejemplo 2: El mismo ejemplo pero con una prueba de una cola. • Datos y suposiciones las mismas anteriores. • Hipótesis: H o : μ 30 y H a : μ 30 • Cálculo de la estadística de prueba: x 0 27 30 z 2.12 / n 20 / 10 • Regla de decisión: Si el zcalc cae en la zona de • rechazo se rechaza Ho. Como es una prueba de una cola o unilateral se busca en la tabla que valor de z tiene una probabilidad de 0.05 y es -1.645. Decisión estadística y Conclusión: Como -2.12 es menor que -1.645 se rechaza Ho y se concluye que la media de la población es menor de 30 años. Ejemplo 3: Muestreo a partir de una población normal y varianza desconocida. Cuando se desconoce la varianza de la población la estadística de prueba es : x 0 t s/ n Ej 3: Se tiene una muestra de 14 varones sanos con diferentes IMC (peso/est2) para probar una técnica de medición para estudios metabólicos. Se quire saber si es posible concluir que la media del IMC no es 35. Individuo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 •Datos: IMC 23 25 21 37 39 21 23 24 32 57 23 26 31 45 • Supuestos : Los 14 individuos siguen una distribución normal. Ejemplo 3: continuación… H o : μ 35 y H a : μ 35 • Hipótesis: • Estadística de prueba: dado que se desconoce la • • • • varianza de la población se utiliza s2. Distribución de la estadística de prueba: distribuye t de Student con n-1 grados de libertad. Regla de decisión: A un nivel de significancia de =0.05, si el valor de tcalc es mayor que tcrítico (2.1604) entonces se rechaza H0. 30.5 35 t 1.58 Cálculo de la estadística de prueba: 10.64 / 14 Decisión estadística: -1.58 cae en la zona de no rechazo por lo tanto no se rechaza H0. Pruebas de hipótesis para la diferencia de medias de dos poblaciones. Cuando se quieren comparar dos poblaciones se utiliza con mayor frecuencia cualquiera de las siguientes hipótesis: H : 0 y H : 0 0 1 2 A 1 2 H 0 : 1 2 0 y H A : 1 2 0 H 0 : 1 2 0 y H A : 1 2 0 Y también se pueden dar tres situaciones : a.- Cuando el muestreo se hace en poblaciones normales con varianza conocida. b.- Cuando el muestreo se efectúa en poblaciones normales y varianzas desconocidas y c.- Cuando el muestreo se realiza a partir de poblaciones no normales. Ejemplo 4: Muestreo en poblaciones normales y varianza conocida. Se quiere saber si hay diferencias en la concentración de ac.úrico en sujetos normales y con síndrome de Down. Se realizó la medición en 12 pacientes con Down y su media fue de 4.5 mg/mL y en 15 individuos sanos cuya media fue de 3.4 mg/mL. 2 2 x 4 . 5 , 1 ; x 3 . 4 , 1 2 2 1.5; n1 12 y n 2 15 • Datos: 1 • Supuestos: los datos provienen de poblaciones con distribución normal y se conoce su varianza. • Hipótesis: H : 0 y H : 0 0 1 2 A 1 2 Ejemplo 4: continuación… • Estadística de prueba: z ( x1 x2 ) ( 1 2 ) 0 12 n1 22 n2 (4.5 3.4) 0 2.57 1 1.5 12 15 • Distribución de la estadística de prueba: La • • • estadística de prueba sigue una distribución normal estándar. Regla de decisión: H0 se rechaza a menos que el valor de zcalc entre los valores críticos, si zcrítico está entre+/-1.96, es decir, que -1.96<zcalc<+1.96. Decisión estadística: Se rechaza H0 porque 2.57>1.96. Conclusión: Con los datos disponibles es posible detectar diferencias estadísticamente significativas entre las dos concentraciones de ac. Úrico de ambas poblaciones (Down y normal). Ejemplo 5: Muestreo en poblaciones normales y varianza desconocida. Se quiere saber de la destrucción pulmonar en fumadores y no fumadores, específicamente si los fumadores tienen mas daño que los no fumadores. • Datos: x f 17 .5, s f 4.4711 , n f 9; xnf 12 .4, s nf 4.8492 , nnf 16 • Supuestos : la destrucción pulmonar sigue una distribución normal y no se conocen las varianzas poblacionales, pero se suponen que son iguales. Ejemplo 5: continuación… H 0 : f nf , H A : f nf • Hipótesis: • Estadística de prueba: ( x1 x2 ) ( 1 2 ) 0 t s 2 p n1 s 2 p n2 (17.5 12.4) 0 2.6573 21.2165 21.2165 16 9 • Y la varianza combinada se calcula como. (n1 1) s (n2 1) s s n1 n2 2 2 p 2 1 2 2 Ejemplo 5: continuación… • Distribución de la estadística de prueba: Sigue una • • • distribución t de Student con n1+n2 -2 grados de libertad. Regla de decisión: Se rechaza H0 a menos que el tcalc esté entre los valores críticos. En este caso, si tcrítico es +/-1.7139, luego -1.7139<tcalc<+1.7139. Decisión estadística: Se rechaza H0 porque 2.6573>1.7139 y cae en la zona de rechazo. Conclusión: Con los datos experimentales se puede concluir que si hay más daño pulmonar en los fumadores que en los no fumadores. Ejemplo 6: Comparación entre datos pareados Para realizar el análisis se utiliza di que es la diferencia entre pares de observaciones. Se quiere saber la pérdida de peso (IMC) después del trat. con una dieta. • Datos: Antes Después Dif 117,3 111,4 98,4 104,3 105,4 100,4 81,7 89,5 78,2 98,5111111 83,3 85,9 75,8 82,9 82,3 77,7 62,7 69 63,9 75,9444444 -34 -25,5 -22,6 -21,4 -23,1 -22,7 -19 -20,5 -14,3 -22,566667 • Supuestos: Las diferencias distribución normal. di siguen una Ejemplo 6: continuación… • Hipótesis: H 0 : d 0; H A : d 0 • Distribución de la estadística de prueba: Si H0 es • verdadera, la estadística de prueba sigue una distribución t de Student con n-1 grados de libertad. Regla de decisión: A un nivel =0.05, el valor de tcrítico es 1.8595. Se rechaza H0 si el valor de tcalc es menor o igual que el valor crítico. Ejemplo 6: continuación… • Cálculo de la estadística de prueba: d di n 2 ; sd (d i d ) 2 n 1 n di ( n(n 1) di ) 2 ;t d d0 sd • Decisión estadística: Se rechaza H0 porque tcalc=• 12.7395 cae en la región de rechazo. Conclusión: Se puede concluir que el programa de dieta de bajas calorías es eficaz.