Download se rechaza la hipótesis nula ya que
Document related concepts
Transcript
COMPROBACION DE HIPOTESIS, UN PROMEDIO Mario Briones L. MV, MSc 2005 Nuevas ideas en Medicina Veterinaria Hay ciertas razas de perros en las cuales la presentación de glaucoma es más común. Implicancias: ??? Nuevas ideas en Medicina Veterinaria Se pueden utilizar otras sustancias antifúngicas, aparte del verde malaquita para controlar los hongos en los salmones. Implicancias: ??? Beyond science According to Arthur C. Clarke, there are four stages in the acceptance of any new idea. They are:"It's nonsense." "It may be real but it's not important“ "I always said it was important" "I thought of it first!“ For the past two hundred years, science has, for the most part, been stuck permanently in stage one, venturing to stage two only when compelled to by undeniable evidence. "Stones cannot fall from the sky, because there are no stones in the sky," Antoine Lavoisier, father of modern chemistry, told his fellow members of the Academie des Sciences in the 1790s. Fusion is the process taking place in the Sun's core where, at temperatures of millions of degrees, hydrogen atoms are compressed together by elemental forces to form helium and a massive outpouring of energy in the thermonuclear reaction of the hydrogen bomb. It is not difficult, then, to imagine how people who have invested their talent and their lives in the quest to tame such forces are likely to react when told that fusion is possible at room temperature, and in a jam jar. The scientific world was astounded when, in March 1989, Professor Martin Fleischmann of Southampton University and his former student, Professor Stanley Pons of the University of Utah, held a press conference at which they jointly announced the discovery of 'cold fusion' – the production of usable amounts of energy by what seemed to be a nuclear process occurring in a jar of water at room temperature. Fleischmann and Pons told an incredulous press conference that they had passed an electric current through a pair of electrodes made of precious metals -- one platinum, the other palladium -- immersed in a glass jar of heavy water in which was dissolved some lithium salts. This very simple set-up was claimed to produce heat energy between four and ten times greater than the electrical energy they were putting in. No purely chemical reaction could produce a result of such magnitude so, said the scientists, it must be nuclear fusion. Cold Fusion Pons and Fleischmann Hipótesis Hipótesis verdadera falsa Se acepta correcto Error tipo I a=0.05 ó 0.01 significancia Se rechaza Error tipo II correcto b= 0.2 ó menos poder de prueba= 1-b PRINCIPALES SUPUESTOS EN LAS PRUEBAS DE HIPOTESIS. - NORMALIDAD DE LA VARIABLE - CONOCIMIENTO DE LA VARIANZA - COLAS DE LA HIPÓTESIS Normalidad de la variable Significa suponer que la muestra se ha tomado desde una población con distribución normal. Conocimiento de la varianza Significa elegir entre los supuestos: La muestra es pequeña y s2 es sólo un estimador de s2. La muestra es lo suficientemente grande para considerar que se conoce s2 (o bien se conoce por antecedentes previos) Colas de la hipótesis Significa definir, a priori, la desviación desde la hipótesis. Por ejemplo, no es lo mismo la idea: “la estatura de los hombres es diferente de la estatura de las mujeres” que la idea “la estatura de los hombres es mayor que la de las mujeres” (dos y una cola, respectivamente). Comprobación de hipótesis acerca de la media de la muestra de una población Caso I: Supuestos - Población con distribución normal - Desviación estándar conocida - Bilateral Población Promedio de peso : m Muestra Promedio de peso: x Suponga que se toma una muestra y conocemos la distribución de la variable s s/n X m La curva grande es la distribución de la variable, La curva más pequeña es la distribución del estimador. X m Existen por lo tanto, probabilidades determinadas por el área bajo la curva normal, de que nuestro estimador esté reflejando a m La hipótesis más sencilla: Se toma una muestra y se obtiene un promedio: Pertenecerá ese promedio a una población donde la media tiene un valor determinado y conocido??? Respuesta intuitiva (no estadística) Si no es igual al promedio, el estimador no podría estar representándolo Respuesta estadística Todos los estimadores tienen error, por lo tanto, este promedio de la muestra, que no es exactamente igual al postulado (hipotetizado), podría ser un estimador de ese valor de m, con un margen de error (probabilidad de error, cuyo máximo permitido, alfa, podría ser 0.05) Definición de la probabilidad Por ejemplo, se desea tener un 95% de certeza de que un promedio obtenido en una muestra, refleja un valor de m determinado Cuantas unidades de dispersión (error estándar) habrá que cubrir hacia ambos lados del promedio para tener esta certeza? A=1 a/2=0.025 -1.96 Región de rechazo a/2=0.025 0.95 0 1.96 Región de aceptación z Región de rechazo Si se define una probabilidad de 95%, el valor de z que pone límite a esta probabilidad es ±1.96 Ejemplo y pasos de la prueba de hipótesis, para un caso “real”. Varios investigadores están interesados en la concentración media de una enzima en una población. Los antecedentes previos, por datos obtenidos en otras poblaciones, similares a la de interés, pero con diferencias fisiológicas conocidas, indican que esta concentración debería ser diferente. Supóngase que se plantea la siguiente pregunta: ¿Puede concluirse que la concentración media de la enzima en esta población es distinta de 25 ? (no importa la unidad de medición en este caso). Se podrá concluir que la concentración media de la Enzima es distinta de 25 si puede rechazarse la hipótesis nula de que la media es igual a 25. Porque deben existir dos hipótesis?? Para delimitar las probabilidades a verdadero y falso. Hipótesis Nula: representa lo conocido, la ausencia de diferencia: ej. Antes y después de apretar el interruptor de experimento de Pons y Fleishmann: no existe la fusión en frío. Porqué deben existir dos hipótesis?? Hipótesis Alterna: representa el cambio, lo diferente a lo conocido, lo nuevo. La hipótesis que se debe probar como falsa es la nula, de modo que sólo pueda efectuarse cuando se ha obtenido evidencia contundente de que es es falsa. (Por ejemplo, al medir una considerable cantidad de radiación con el experimento de P & F) Porque debe existir dos hipótesis?? Solamente cuando se ha demostrado que la hipótesis nula es falsa, con una probabilidad inferior a un límite alfa (ej. 0.05 ó 5%) de estar equivocado, se podrá tomar considerar que la hipótesis alterna es verdadera, precisamente por ser lo contrario de la hipótesis nula. 1. Datos: Los datos son las mediciones de la enzima hechas en una muestra de 10 individuos de la población de interés. El promedio es 21 y la varianza es 45. 2. Supuestos: Se supone que la muestra proviene de una población de concentraciones de la enzima con distribución normal y una varianza conocida de s2=45. 3. Hipótesis: la hipótesis que debe probarse, o hipótesis nula, es que la concentración media de la enzima en la población es igual a 25. La hipótesis alternativa es que la concentración media de la enzima no es igual a 25 Puede expresarse de la siguiente manera: H0: m = 25 HA: m 25 4. Estadística de prueba: Dado que se está poniendo a prueba una hipótesis acerca de la media de una población, se supone que la población está distribuida normalmente y se conoce la varianza, la estadística de prueba es: Z X m0 s n (Lo que esta expresión dice es que z medirá en unidades estandarizadas de error estándar, la distancia que existe entre la media de la muestra y la media de la población) 5. Distribución de la estadística de prueba: Si la hipótesis nula es verdadera, entonces la estadística de prueba tiene distribución normal con media cero y varianza 1. Explicación: la estadística de prueba es una distancia (entre lo observado y lo hipotetizado), dividido por la dispersión de esa distancia. Si la Ho es verdadera, entonces la fluctuación de este indice está centrada en cero distancia desde m. 6. Regla de decisión: A=1 a/2=0.025 -1.96 Región de rechazo a/2=0.025 0.95 0 1.96 Región de aceptación z Región de rechazo Se rechazará la hipótesis nula si el valor de z calculado es menor que -1.96 o mayor que 1.96 7. Estadística de prueba calculada: 21 25 4 z 1.88 6.7 2.12 10 8. Decisión estadística: no se puede rechazar la hipótesis nula ya que -1.88 está en el área de aceptación. 9. Se concluye que m puede ser igual a 25. En otras palabras, la muestra que tiene un promedio de 21 ha sido tomada, con un 95% de certeza, en una población donde la media es 25. Comprobación de hipótesis acerca de la media de la muestra de una población Caso II: Supuestos - Población con distribución normal - Desviación estándar conocida - Unilateral Con los datos del ejemplo anterior en lugar de plantear m 25, plantear m< 25 Se puede contestar si se rechaza la hipótesis nula m 25 1. Datos: ejemplo anterior 2. Supuestos: ejemplo anterior 3. Hipótesis H0: m 25 HA: m< 25 4. Estadística de prueba X-m0 z= -------s/n 5. Distribución de la estadística de prueba: ejemplo anterior 6. Regla de decisión: sea a=0.05 dónde ubicar la región de rechazo? Valores pequeños rechazan la hipótesis nula. La región de rechazo deberá estar en la cola inferior de la distribución. Toda la probabilidad de a estará en esa cola. 25 A=1 a=0.05 0.95 -1.64 0 Región de aceptación z Región de rechazo Regla: se rechaza H0 si el valor calculado de la estadística de prueba es menor o igual que -1.645 7. Estadística de prueba calculada 21 - 25 z= -------- = -1.88 45/10 8. Decisión estadística: se rechaza la hipótesis nula ya que -1.88 < -1.645 9. Conclusión: La media verdadera es menor a 25 Esto significa que hay casos en los cuales, el cambio en la hipótesis puede rechazar una hipótesis nula unilateral que ha sido aceptada como bilateral. Comprobación de hipótesis acerca de la media de la muestra de una población Caso III: supuestos - Población con distribución normal - Desviación estándar desconocida - Bilateral Se midieron las concentraciones de amilasa en suero de una muestra aleatoria de 15 personas aparentemente sanas. Se quiere saber si se puede concluir que la media de la población de la cual se obtuvo la muestra es distinta de 120. 1. Datos: Determinaciones de amilasa en suero de 15 personas aparentemente sanas. La media y la desviación estándar calculadas a partir de la muestra son, respectivamente, 96 y 35 unidades/100 ml. 2. Supuestos: Las 15 determinaciones constituyen una muestra aleatoria de una población de determinaciones con distribución normal. Se desconoce la varianza de la población. 3. Hipótesis: H0: m = 120 HA: m 120 4. Estadística de prueba: X - m0 t = ----------s/n 5. Distribución de la estadística de prueba: está distribuida como la t de student con n-1 grados de libertad, si la hipótesis nula es verdadera. 6. Regla de decisión: sea a= 0.05 como la prueba es bilateral, se ubica a/2= 0.025 en cada cola. Los grados de libertad son 14. Los valores de t son 2.1448 y -2.1448 rechazo rechazo -2.14 0 2.14 aceptación t Regla: se rechaza H0 si la t calculada es mayor o igual a 2.1448 o menor o igual que -2.1448 Estadística de prueba calculada: 96 - 120 -24 t= ----------- = ------= -2.65 35/15 9.04 8. Decisión estadística: Se rechaza H0 ya que -2.65 cae en la región de rechazo. 9. Conclusión: La conclusión, basada en estos datos, es que la media de la población de la cual provino esta muestra no es 120.