Download PRUEBAS DE HIPÓTESIS CON MUESTRAS GRANDES
Document related concepts
no text concepts found
Transcript
Probabilidad y Estadística Pruebas de hipótesis 11 PRUEBAS DE HIPÓTESIS CON MUESTRAS GRANDES INTRODUCCIÓN. Recordemos que el objetivo de la estadística inferencial es conocer características de la población a partir de la información contenida en una muestra. En particular, se hacen inferencias acerca de los parámetros poblacionales desconocidos, basadas en la información contenida en una muestra. En Estadística Inferencial hay dos formas de realizar inferencias acerca de un parámetro poblacional: podemos estimar su valor que es lo que vimos la clase pasada, o bien, probar (o comprobar) una hipótesis acerca de su valor, que es lo que vamos ver esta clase. En la clase pasada vimos dos tipos de estimaciones: Puntual: En este caso para estimar el valor de un parámetro poblacional , usamos un estimador puntual insesgado y podemos calcular la probabilidad de que P(| | < c) que es una medida del error que cometemos al usar para estimar . Por intervalo: En este caso para estimar el valor de un parámetro poblacional , usamos un estimador puntual insesgado, como para determinar un intervalo [ c , + c ] donde es la desviación estándar de la distribución muestral de . En particular, si z/2 es tal que P(z/2 < z ) = /2, o equivalentemente, P(0 < z < z/2) = (1 entonces [ z/2 , + z/2 ] es un intervalo de confianza de 1. es decir, P([ z/2 , + z/2 ] contenga a ) =1. Para calcular las probabilidades anteriores, se usa la distribución muestral de . Se supuso que se trabajaba con muestras grandes para que esta distribución fuera aproximadamente normal. Hoy vamos a ver como se puede realizar una inferencia acerca de un parámetro poblacional probando (o comprobando) una hipótesis acerca de su valor. Veamos algunos ejemplos en donde se puede usar una prueba de hipótesis: Un investigador en medicina propone la hipótesis de que un medicamento A es más efectivo que otro B para curar una cierta enfermedad. Un técnico de control de calidad propone la hipótesis de que un nuevo método de montaje produce sólo 5% de artículos defectuosos. Un educador afirma que dos métodos para enseñar tiene la misma eficacia. Un candidato político afirma que la mayoría de los votantes están de su parte. En todos estos casos la hipótesis o afirmación se somete a una prueba estadística para compararla con los resultados de los datos muestrales. Vamos a ver: Qué función de las mediciones muestrales debe utilizarse para realizar la prueba. Cómo se decide si una muestra no concuerda con la hipótesis Cuándo debe rechazarse la hipótesis, aceptarse la hipótesis o no decidir nada acerca de la hipótesis. Cuál es la probabilidad de tomar una decisión equivocada. Probabilidad y Estadística Pruebas de hipótesis 12 ______________________________________________________________________ ELEMENTOS DE UNA PRUEBA DE HIPÓTESIS El objetivo de toda prueba de hipótesis es probar una hipótesis acerca del valor de un parámetro poblacional. Entonces el primer elemento de la prueba de hipótesis es la afirmación o hipótesis sobre el valor de uno o más parámetros poblacionales y recibe el nombre de hipótesis alternativa. Hipótesis alternativa, Ha: afirmación o hipótesis sobre el valor de uno o más parámetros poblacionales. Se denota con Ha. El segundo elemento es la hipótesis nula que es una negación de la hipótesis alternativa. Hipótesis nula, H0: negación de la hipótesis alternativa. El soporte para la validez de la hipótesis alternativa Ha se obtiene mostrando, usando los valores muestrales como evidencia, que la hipótesis nula H0 es falsa. Así el soporte de una hipótesis se obtiene mostrando la falta de soporte para la otra. Ejemplo. a) Se cree que no más del 50% de los consumidores prefiere un producto de marca A. Se propone como hipótesis alternativa que la proporción p de consumidores que prefieren la marca A es mayor que 50% = 0.5 Ha: p > 0.5 Se propone además H0: p = 0.5 La decisión de rechazar H0 y de aceptar Ha, se basa en la información contenida en una muestra de n mediciones, tomadas de una población. b) Se seleccionan 100 consumidores y se les pregunta si prefieren la marca A. En este caso la muestra se extrae de una población binomial con parámetro p. En función de los datos de una muestra se obtiene un número llamando la estadística de prueba (que puede ser un estimador). c) Por ejemplo, se obtiene x la cantidad de consumidores que prefieren A de los 100 de la muestra. El conjunto de todos los valores que puede tomar la estadística de prueba se divide en dos subconjuntos o regiones: región de rechazo región de aceptación Si la estadística cae en la región de rechazo, se rechaza H0 a favor de Ha. Si la estadística cae en la región de aceptación, se acepta H0. La región de rechazo debe contener valores que apoyen Ha. d) Como 0 x 100, es decir, x [0, 100], Ha: p > 0.5 y H0: p = 0.5 se podría tener región de rechazo: [60, 100] región de aceptación: [0, 60) (observar que la región de rechazo contiene valores 60 que apoyan Ha). Supongamos que x = 99. Como x está en la región de rechazo, rechazamos H0 a favor de Ha y concluimos que la proporción p de consumidores que prefieren la marca A es mayor a 0.5. En general, la región de rechazo incluye valores de x que apoyan Ha . En ese ejemplo, Ha: p > 0.5, por lo tanto la región de rechazo incluye valores de x grandes, que son los que hacen poco probable que p 0.5. La región de aceptación y que por lo tanto apoya H0 incluye entonces valores de x chicos. Más allá Probabilidad y Estadística Pruebas de hipótesis 13 de estas consideraciones, la determinación de las regiones de rechazo y aceptación depende de la probabilidad de cometer errores con la que se quiera trabajar. Antes de ver esto, resumamos cuales son los elementos de una prueba de hipótesis. Resumiendo Elementos de una prueba estadística. 1. Hipótesis alternativa. 2. Hipótesis nula. 3. Estadística de prueba. 4. Región de rechazo. Analicemos los errores que se pueden cometer al aceptar o rechazar H0, cuales son las probabilidades de cometer cada uno de ellos y como se usa esto para determinar las regiones de rechazo y aceptación. La hipótesis nula H0 puede ser verdadera o falsa, cosa que no conocemos. Si H0 es verdadera y la rechazamos se comete un error llamado de tipo I. Si H0 es falsa y la aceptamos se comete un error llamado de tipo II. Tabla de decisiones. Decisión Rechazar H0 Aceptar H0 Verdadera Error tipo I Decisión correcta Hipótesis nula Falsa Decisión correcta Error tipo II La validez o bondad de una prueba de hipótesis se mide mediante las probabilidades de cometer cada uno de estos errores probabilidad de cometer un error de tipo I probabilidad de cometer un error de tipo II corresponde a la región de rechazo. corresponde a la región de aceptación. Volvamos al ejemplo que estábamos considerando. Ejemplo. Sea p la proporción de consumidores que prefieren la marca A. a) Ha: p > 0.5 H0: p = 0.5 b) Se seleccionan 100 consumidores y se les pregunta si prefieren la marca A. En este caso la muestra se extrae de una población binomial con parámetro p. c) Estadística de prueba: x la cantidad de consumidores que prefieren A de los 100 de la muestra. Error tipo I: Supongamos que H0 es verdadera, es decir, se cumple que p = 0.5. Entonces se puede cometer un error tipo I, cuando se rechaza H0. Veamos como se calcula . Como H0 es verdadera, x tiene una distribución binomial con parámetro p = 0.5. Como el tamaño n = 100 de la muestra es grande se puede suponer normal con x = n p = 100 (0.5) = 50 x = npq = 100(0.5)(1 0.5) = 5 Probabilidad y Estadística Pruebas de hipótesis 14 Si se define como región de rechazo: x + 2 = 60, la probabilidad de cometer un error tipo I, es decir de rechazar H0 siendo esta verdadera es = P( x 60 ) = 0.025. Es decir x caerá en la región de rechazo 2.5% de las veces, cometiéndose un error al rechazar H0 siendo verdadera. Vemos además que el valor de queda fijo al fijar la región de rechazo. Error tipo II: Supongamos que H0 es falsa, es decir, se cumple que p 0.5. Entonces se puede cometer un error tipo II. Como H0 es falsa, x tiene una distribución binomial con parámetro p desconocido. Como el tamaño n = 100 de la muestra es grande se puede suponer normal con = n p = 100 p = npq = 100 p(1 p) Aunque sabemos que la distribución de x es normal, como desconocemos p no es imposible calcular la probabilidad de x que caiga en un determinado intervalo, y por ende . Sin embargo, podemos ver como se comporta de acuerdo a si p se encuentra cerca o lejos del valor estipulado en H0, que es 0.5. Probabilidad y Estadística Pruebas de hipótesis 15 Si p = 0.9, en la muestra de 100 consumidores casi la totalidad estará a favor de la marca A, con lo cual x estaría bastante cerca de 100. De este modo, tendríamos una evidencia muy fuerte para rechazar H 0: p = 0.5, y por ende de no equivocarnos. Es decir, en este caso es chico. Si p = 0.55, en la muestra de 100 consumidores casi la mitad estaría a favor de la marca A. De este modo, tendríamos evidencia como para aceptar H0: p = 0.5, y por ende de equivocarnos. Es decir, en este caso es grande. En definitiva, mientras mayor sea la diferencia entre p real y el que propone H 0, menor es probabilidad de cometer un error tipo II, es decir, menor es . Relación entre los dos tipos de errores. corresponde a la región de rechazo. corresponde a la región de aceptación. Mientras más grande (chica) es la región de rechazo más chica (grande) es la región de aceptación. Si crece (disminuye) entonces disminuye (crece). En general se tiene, Propiedades de y 1. El valor de se fija al escoger la región de rechazo. 2. El valor de dependerá del valor que se use para definir H0. Mientras más grande (chica) sea la diferencia entre el valor que se use para definir H 0 y el valor real del parámetro, menor (mayor) será . 3. Si crece (disminuye) entonces disminuye (crece). 4. Si se aumenta el tamaño de la muestra y disminuyen. Al idear una prueba de hipótesis se consideran los valores y que se quieren tolerar. Los pasos que se suelen seguir son: 1. Se especifica . 2. En función de , se determina la región de rechazo. 3. Se selecciona un tamaño n de muestra para lograr un adecuado. El último paso es el que en general no se puede llevar a cabo porque es necesario conocer los distintos valores de para diferentes valores del parámetro en prueba. En la práctica, si la estadística de prueba cae en la región de rechazo, podemos cometer un error tipo I y sabemos cual es la probabilidad de cometerlo. Si la estadística de prueba cae en la región de aceptación, con lo cual se está en riesgo de cometer un error de tipo II, no se toma decisión alguna y se recolectan más datos. ___________________________________________________________________________ PRUEBA ESTADÍSTICA PARA MUESTRAS GRANDES Ahora enunciaremos lo anterior, que se vio para un ejemplo concreto (parámetro p de una población binomial), de modo general. Recordemos que una estadística de prueba es un número que se obtiene en función de los datos de una muestra. Se puede usar como estadística de prueba un estimador puntual insesgado que tenga una distribución de muestreo aproximadamente normal para tamaños grandes de muestra como los que vimos la clase pasada: La media muestral x es un estimador insesgado de la media poblacional . La proporción muestral p̂ es un estimador insesgado del parámetro p. x 1 x 2 es un estimador insesgado del parámetro 1 2. p̂ 1 p̂ 2 es un estimador insesgado del parámetro p1 p2. En general, sea es un estimador insesgado de un parámetro . Se supone que es un estimador insesgado que tiene una distribución de muestreo aproximadamente normal. Probabilidad y Estadística Pruebas de hipótesis 16 Supongamos que se quiere probar que el parámetro poblacional es mayor que un cierto valor 0, es decir Ha: > 0 Se propone entonces como hipótesis nula H0: = 0 Estadístico de prueba: La región de rechazo debe contener valores de que apoyen Ha, > 0. Así se elige un C > 0, y se define región de rechazo: { > 0 + C}. 0 + C valor crítico de la estadística de prueba (separa la región de rechazo de la región de prueba). Si se quiere probar que el parámetro poblacional es menor que un cierto valor 0, Ha: < 0 H0: = 0 Estadístico de prueba: La región de rechazo debe contener valores de que apoyen Ha, < 0. región de rechazo: { < 0 C} En ambos casos se dice que es una prueba estadística de una extremidad o cola pues la región de rechazo se localiza en un sólo extremo de la distribución muestral de la estadística de prueba. Si se quiere probar que el parámetro poblacional es distinto de cierto valor 0, se tendría Ha: 0 H0: = 0 Estadístico de prueba: región de rechazo: { < 0 C} o { > 0 + C} y se dice que es una prueba estadística de dos extremidades o colas pues la región de rechazo se localiza en ambos extremos de la distribución muestral de la estadística de prueba. Probabilidad de un error tipo I. Es la probabilidad de que caiga en la región de rechazo siendo H0 verdadera. Luego es el área, correspondiente a la región de rechazo, bajo la curva de la distribución muestral de , que es normal con media = 0 y desviación estándar ˆ . En el caso de una prueba de dos colas, a cada mitad de la región le corresponde una probabilidad / 2. Ha: > 0, Para pruebas de una cola: P({ < 0 C}) = P({ > 0 + C}) = (ver Figura 7.3, p. 243) Ha: < 0, Para pruebas de dos colas: Ha: 0 P({ < 0 C} { > 0 + C}) = P({ < 0 C}) + P({ > 0 + C}) = P({ < 0 C}) = P({ > 0 + C}) = /2 Probabilidad de un error tipo II. (ver Figura 7.4, p. 243) Es la probabilidad de que caiga en la región de aceptación siendo H0 falsa. Supongamos que H0 es falsa y que en realidad = a siendo a desconocido. Luego la distribución muestral de , es normal con media a y desviación estándar ˆ . Con esta distribución de probabilidad se tiene (ver Figura 7.5, p. 244) Para pruebas de una cola: Ha: > 0, Ha: < 0, P({ > 0 C}) = P({ < 0 + C}) = Para pruebas de dos colas: Ha: 0, P({0 C < < 0 + C}) = Probabilidad y Estadística Pruebas de hipótesis 17 (ya no hay simetría respecto a 0, sino respecto a a). Si se utiliza como estadístico de prueba la variable z= ˆ 0 ˆ que es la desviación de una variable aleatoria , respecto a 0, expresada en unidades de ˆ . si = P(error tipo I), se pueden reescribir las pruebas anteriores como Prueba estadística para muestras grandes 1. Hipótesis nula. H0: = 0. 2. Hipótesis alternativa. Prueba de una extremidad (o cola) Ha: > 0 ( < 0) Prueba de dos extremidades (o colas) Ha: 0. 3. Estadística de prueba. z = ˆ 0 ˆ 4. Región de rechazo. Prueba de una extremidad (o cola):z > z (z < z) z es tal que P(z > z) = P(z < z) = . Prueba de dos extremidades (o cola): z > z/2 o z < z/. z/2 es tal que P(z > z/2) = P(z < z/2) = /2. (ver figuras del recuadro p. 245) Suposición: Se seleccionó una muestra aleatoria de tamaño grande n ( 30). En particular se tiene ___________________________________________________________________________ PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL Prueba estadística para en el caso de muestras grandes 1. Hipótesis nula. H0: = 0. 2. Hipótesis alternativa. Prueba de una extremidad (o cola) Ha: > 0 ( < 0) Prueba de dos extremidades (o cola) Ha: 0. 3. Estadística de prueba. z = x 0 x = x 0 / n Si no se conoce se sustituye por s. 4. Región de rechazo. Prueba de una extremidad (o cola):z > z (z < z) z es tal que P(z > z) = P(z < z) = . Prueba de dos extremidades (o cola): z > z/2 o z < z/. z/2 es tal que P(z > z/2) = P(z < z/2) = /2. Suposición: Se seleccionó una muestra aleatoria de tamaño n 30. Probabilidad y Estadística Pruebas de hipótesis 18 Ejemplo. La producción diaria de una planta industrial química registrada durante n = 50 días tiene una media x = 871 toneladas y una desviación estándar s = 21 toneladas. (a) Probar la hipótesis de que el promedio de la producción diaria es = 880 toneladas por día contra la alternativa de que es mayor o menor a 880 toneladas por día. Hipótesis nula. H0: = 880. Hipótesis alternativa. Prueba de dos extremidades (o cola) Ha: 880. Estadística de prueba. z = x 0 / n = x 880 / 50 x 880 = s / 50 x 880 21 / 50 x 880 2.97 Región de rechazo. Prueba de dos extremidades (o cola): z > z/2 o z < z/. Si se quiere = 0.05, entonces z/ = 1.96. Luego Región de rechazo. z > 1.96 o z < 1.96 (ver Figura 7.6, p. 246) Como x = 871, entonces z = 3.03 que cae en la región de rechazo. Así rechazamos que el promedio de la producción diaria es = 880 toneladas por día y la probabilidad de equivocarnos es de 5%. Si usáramos intervalos de confianza tendríamos que el intervalo x z/ / n 871 5.82 tiene un coeficiente de confianza 1 = 0.95 = 95%. Hay un 95% de probabilidad de que este intervalo contenga a . Entonces rechazaríamos = 880 pues no cae en este intervalo. Como x = 871 < 880, se sospecharía que en realidad < 880. (b) ¿Cuál es la probabilidad de aceptar H0 si el valor real de fuera 870 toneladas?. Región de aceptación. z 1.96 x 880 21 / 50 1.96 ( x 880) 21 x 1.96 50 21 1.96 + 880 50 x de 874.18 a 885.82 es el área, correspondiente a la región de aceptación, bajo la curva normal que tiene media = 870 desviación estándar x = 21 = 2.97 50 = 0.0793 (ver Figura 7.7, p. 247) Así si fuera en realidad 870 toneladas, la probabilidad de aceptar H0: = 880 es 7.9%. ________________________________________________________________________________ PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS MEDIAS POBLACIONALES Prueba estadística para 1 2 en el caso de muestras grandes 1. Hipótesis nula. H0: 1 2 = D0. 2. Hipótesis alternativa. Prueba de una extremidad (o cola) Ha:1 2 > D0 (1 2 < D0) Prueba de dos extremidades (o cola) Ha:1 2 D0. Probabilidad y Estadística 3. Estadística de prueba. z = Pruebas de hipótesis x 1 x 2 D0 x x 1 = 19 x 1 x 2 D0 2 12 n1 22 n2 Si no se conocen 1 y 2 se sustituyen por s1 y s2. 4. Región de rechazo. Prueba de una extremidad (o cola):z > z (z < z) z es tal que P(z > z) = P(z < z) = . Prueba de dos extremidades (o cola): z > z/2 o z < z/. z/2 es tal que P(z > z/2) = P(z < z/2) = /2. Suposición: Los dos muestreos son aleatorios e independientes de tamaños n1 30 y n2 30. ___________________________________________________________________________ PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL Prueba estadística para p en el caso de muestras grandes 1. Hipótesis nula. H0: p = p0. 2. Hipótesis alternativa. Prueba de una extremidad (o cola) Ha: p > p0 (p < p0) Prueba de dos extremidades (o cola) Ha: p p0. 3. Estadística de prueba. z = pˆ p 0 pˆ = pˆ p 0 p0 q0 n 4. Región de rechazo. Prueba de una extremidad (o cola):z > z (z < z) z es tal que P(z > z) = P(z < z) = . Prueba de dos extremidades (o cola): z > z/2 o z < z/. z/2 es tal que P(z > z/2) = P(z < z/2) = /2. Suposición: El muestreo aleatorio satisface las características de un experimento binomial y el tamaño de la muestra n 30. ___________________________________________________________________________ PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES POBLACIONALES Prueba estadística para p1 p2 en el caso de muestras grandes 1. Hipótesis nula. H0: p1 p2 = D0. 2. Hipótesis alternativa. Prueba de una extremidad (o cola) Ha: p1 p2 > D0 (p1 p2 < D0) Prueba de dos extremidades (o cola) Ha: p1 p2 D0. 3. Estadística de prueba. z = pˆ 1 pˆ 2 D0 pˆ pˆ 1 2 = pˆ 1 pˆ 2 D0 p1 q1 p 2 q 2 n1 n2 Como p1 y p2 se desconoce, Si D0 = 0, z = pˆ 1 pˆ 2 1 1 pˆ qˆ n1 n 2 , donde p̂ = x1 x 2 . n1 n2 Probabilidad y Estadística Si D0 0, z = Pruebas de hipótesis 110 pˆ 1 pˆ 2 D0 pˆ 1 qˆ1 pˆ 2 qˆ 2 n1 n2 4. Región de rechazo. Prueba de una extremidad (o cola):z > z (z < z) z es tal que P(z > z) = P(z < z) = . Prueba de dos extremidades (o cola): z > z/2 o z < z/. z/2 es tal que P(z > z/2) = P(z < z/2) = /2. Suposición: Los dos muestreos son aleatorios e independientes, satisfacen las características de experimentos binomiales y los tamaños de las muestras son n1 30 y n2 30. ___________________________________________________________________________ VALORES p En lo que sigue p no se refiere al parámetro de una población binomial. La probabilidad de un error tipo I, , suele denominarse nivel de significación asociada a una prueba estadística. El valor p, es el mínimo nivel de significación para el cual los datos observados indican que se tendría que rechazar la hipótesis. El mínimo nivel de significación p se determina en función de la mínima región de rechazo que se puede considerar teniendo en cuenta que se ha observado un determinado valor para la estadística de prueba. La idea es que un valor observado de la estadística de prueba distinto al que afirma H 0, apoya el rechazo de H0. Por lo tanto, la región de rechazo debería contener mínimamente este valor observado de la estadística de prueba. Ejemplo. La producción diaria de una planta industrial química registrada durante n = 50 días tiene una media x = 871 toneladas y una desviación estándar s = 21 toneladas. Hipótesis nula. H0: = 880. Hipótesis alternativa. Prueba de dos extremidades (o cola) Ha: 880. Estadística de prueba. z = x 0 / n = x 880 / 50 x 880 s / 50 = x 880 21 / 50 Se tiene el valor x = 871, entonces z = 3.03 es un valor observado de z. Región de rechazo. Prueba de dos extremidades (o cola): z > z/2 o z < z/. (Antes se usó = 0.05, entonces z/ = 1.96. Luego Región de rechazo. z > 1.96 o z < 1.96) Veamos como se determina el valor p de esta prueba. z = 3.03 es un valor observado de z. La región de rechazo de H0, a favor de Ha, debería incluir mínimamente este valor, por lo tanto la mínima región de rechazo posible sería z > 3.03 o z < 3.03 p es la probabilidad de cometer un error tipo I con esta región de rechazo p = P(z 3.03) + P(z 3.03) = 0.0024. Por lo tanto, al utilizar esta prueba estadística se elegirán valores de 0.0024.