Download s 2 1 +
Document related concepts
Transcript
COMPROBACION DE HIPOTESIS SOBRE DOS PROMEDIOS Mario Briones L. MV, MSc 2005 Comprobación de hipótesis acerca de la Media de la muestra de una población Caso I: Supuestos - Población con distribución normal - Desviación estándar conocida - Bilateral Comprobación de hipótesis acerca de la Media de la muestra de una población Cada vez que se comparan dos promedios, se obtiene una diferencia entre las infinitas diferencias posibles entre ambos grupos o poblaciones, con muestras del mismo tamaño. POBLACION A POBLACION B por ejemplo, si se quiere comparar el peso de dos poblaciones de peces, sólo podemos tener acceso a dos muestras, una de cada población. Cada una de estas muestras, como ya sabemos, tiene error. Por lo tanto, cada vez que se repitiese la comparación, habría distintos promedios y distintas diferencias entre cada una de las dos poblaciones. Es importante aquí comprender que si en realidad no hay diferencia entre ambos promedios poblacionales (caso en que la hipótesis nula es verdadera), entonces la sumatoria de todas las diferencias obtenidas en cada una de las sucesivas comparaciones, SERÍA CERO. DISTRIBUCION DE LA DIFERENCIA Si no existe diferencia entre m1 y m2, muestreos sucesivos darán similar cantidad de valores positivos y negativos a la expresión x1 -x2, lo que significa que m1-m2=0 Esta es la unidad de distribución de esta curva: la varianza de las diferencias. s2x1-x2=s21/n1 +s22/n2 mx1-x2=m1 -m2=0 x1-x2 (x1-x2) - (m1-m2) Z=---------------------------------------s21/n1 + s22/n2 X2-X1 X1 X2 Puede verse que si la hipótesis nula (ausencia de diferencia entre los promedios) es verdadera, la media real m de la diferencia es cero, ya que se cancelan todas las diferencias al estarse estimando con ambas muestras, el mismo valor X2-X1 X1 X2 Puede verse que si la hipótesis nula (ausencia de diferencia entre los promedios) es verdadera, la media real m de la diferencia es cero, ya que se cancelan todas las diferencias al estarse estimando con ambas muestras, el mismo valor X2-X1 X2 X1 Todas estas son posibles hipótesis nulas y alternativas al comparase dos promedios, uni o bilaterales. H0: m2 - m1= 0 HA: m2 - m1 0 H0: m2 - m1 0 HA: m2 - m1< 0 H0: m2 - m1 0 HA: m2 - m1> 0 Comprobación de hipótesis acerca de dos medias Caso I: Supuestos -Muestreo a partir de poblaciones con distribución normal - Desviación estándar conocida - Bilateral Un grupo de investigadores desea saber si los datos que han reunido proporcionan evidencia suficiente que indique una diferencia en las concentraciones medias de ácido úrico en suero entre individuos normales e individuos con síndrome de Down. Se dirá que los datos proporcionan dicha evidencia si puede rechazarse la hipótesis nula de que las medias son iguales. 1. Datos: Mediciones de ácido úrico en el suero de 12 individuos con síndrome de Down y 15 individuos normales. Los promedios son Individuos con síndrome de Down, X1= 4.5 mg/100 ml Individuos normales, X2= 3.4 mg/100 ml 2. Supuestos: Los datos constituyen dos muestras aleatorias independientes, cada una extraída de una población con distribución normal y con varianza igual a 1mg/100ml. 3. Hipótesis: H0: m2 - m1= 0 HA: m2 - m1 0 4. Estadística de prueba: (X1 - X2) - (m1 - m2) z= s 21 s 22 + n1 n2 5. Distribución de la estadística de prueba: Normal unitaria, cuando la hipótesis nula es verdadera 6. Regla de decisión: Sea a= 0.05. Los valores críticos de z son 1.96 Se rechaza H0 a menos que -1.96 < z calculada < 1.96 7. Estadística de prueba calculada: (4.5 - 3.4) - 0 z= 1 1 + 12 15 1.1 = 0.39 = 2.82 8. Decisión estadística: Se rechaza H0 ya que 2.82 > 1.96 9. Conclusión: En base a los datos disponibles, hay una indicación de que las medias no son iguales para la concentración de ácido úrico entre individuos normales e individuos con síndrome de Down. Comprobación de hipótesis acerca de dos medias Caso I: Supuestos -Muestreo a partir de poblaciones con distribución normal - Desviación estándar desconocida - Bilateral Alternativas varianza desconocida e igual en ambas poblaciones (n1-1)s21 + (n2-1)s22 s2P= n1 +n2 -2 varianza desconocida y distinta en ambas poblaciones Se dispone de valores de perímetro torácico en caballos chilenos adultos, machos y hembras. Se quiere comprobar que el sexo del animal influye sobre el perímetro del tórax. Para esto se debe rechazar la Hipótesis nula de que el sexo de los caballos no tiene importancia o no influye sobre el perímetro. 1. Datos: machos n1= 38 X1= 171.83 cm s1= 4 cm hembras n2=39 X2= 173.6 cm s2= 6.15 cm 2. Supuestos: Los datos constituyen muestras aleatorias INDEPENDIENTES, se desconoce la varianza pero se supone que es igual en ambas poblaciones. (Independientes significa que no existe relación entre los individuos de una y otra población. Por ej. No son hermanos) 3. Hipótesis: H0: m2 - m1= 0 HA: m2 - m1 0 4. Estadística de prueba: (X1 - X2) - (m1 - m2) t= s2 P s2 P + n1 n2 5. Distribución de la estadística de prueba Cuando la hipótesis nula es verdadera, la estadística de prueba sigue la distribución t de Student con n1 + n2 - 2 grados de libertad 6. Regla de decisión Sea a= 0.05, los valores críticos de t son 1.99 Se rechaza H0 a menos que -1.99<tcalculada<1.99 7. Estadística de prueba calculada: A) varianza promedio s2P (n1-1)s21 + (n2-1)s22 s2P= n1 +n2 -2 (38-1)42 + (39-1)6.152 592 + 1437.3 s2P= = = 27.1 38 + 39 -2 75 B) Estadística calculada (171.83 - 173.6) - 0 t= -1.77 = 27.1 27.1 + 38 39 = -1.26 1.4 8. Decisión estadística: No puede rechazarse H0, ya que -1.99 < 1.26 < 1.99 9. Conclusión: Con los datos disponibles no se puede concluir que el perímetro torácico de los caballos chilenos, machos y hembras, sea diferente. Intervalo de confianza para la media real de la diferencia en la población Cuando se conoce la varianza de la población ( x1 x 2 ) E < (m1 m2 ) < ( x1 x2 ) E E za / 2 s 2 1 n1 s 2 2 n2 Ej: concentración de ácido úrico en individuos con y sin sídrome de Down Individuos con síndrome de Down, X1= 4. 5 mg/100 ml Individuos normales, X2= 3.4 mg/100 ml Diferencia observada 4.5 – 3.4= 1.1 1 1 E 1.96 0.759 12 15 Límite inferior= 1.1–0.759= 0.341 Límite superor= 1.1+0. 759 = 1.859 Con un 95% de confianza la diferencia real entre los promedios de las concentraciones de ácido úrico de las personas con y sin síndrome de Down, se encuentra entre 0.341 y 1. 859 mg/100 ml (observe que este intervalo no incluye al cero). Intervalo de confianza para la media real de la diferencia en la población Cuando no se conoce la varianza de la población ( x1 x 2 ) E < (m1 m2 ) < ( x1 x2 ) E E t P / Gl 2 P 2 P s s n1 n2 Ej: perímetro toráxico en caballos machos y hembras Perímetro de machos= 171.83 cm Perímetro de hembras= 173.6 cm Diferencia observada= 171.83 – 173.6 = –1.77 27.1 27.1 E 1.99 2.36 38 39 Límite inferior= –1.77–2.36 =–4.13 Límite superior= –1.77+2.36=0.59 Con un 95% de confianza la media real de la diferencia puede ser cero