Download UNIVERSIDAD CENTRAL DE VENEZUELA
Document related concepts
no text concepts found
Transcript
UNIVERSIDAD CENTRAL DE VENEZUELA FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES ESCUELA DE SOCIOLOGÍA DEPARTAMENTO DE ESTADÍSTICA INFERENCIA ESTADÍSTICA ANOTACIONES SOBRE CONSTRASTE DE HIPÓTESIS Prof. Simón Cabrera Prof. Edmundo Pardo Septiembre, 2011 NATURALEZA DEL CONTRASTE DE HIPÓTESIS Un contraste de hipótesis también denominado test de hipótesis o prueba de significación, es una metodología de inferencia estadística para juzgar si una propiedad que se supone cumple una población estadística, es compatible con lo observado en una muestra aleatoria de dicha población. Mediante esta teoría, se aborda el problema estadístico, considerando una hipótesis determinada H0 y una hipótesis alternativa H1 y se busca dirimir cuál de las dos es la hipótesis verdadera, tras aplicar el problema estadístico a un cierto número de experimentos. El contraste está fuertemente asociado a los considerados errores de tipo I y II en estadística, que definen respectivamente, la posibilidad de tomar un suceso verdadero como falso o uno falso como verdadero. La utilidad del contraste de hipótesis proviene del hecho de constituir uno de los instrumentos más apropiados para tomar decisiones en condiciones de incertidumbre. Por ejemplo, supongamos que una empresa está estudiando la posibilidad de implantar un nuevo sistema de propaganda para aumentar las ventas promedio por cliente. Con el sistema de propaganda actual, las ventas promedio por cliente son de BsF. 200. El nuevo sistema de propaganda supone un incremento en los costos, que se estima conveniente, si las ventas promedio por cliente aumentan. El problema de toma de decisiones a que se enfrenta la empresa es uno con dos posibles acciones: a. Implantar el nuevo sistema de propaganda. b. No implantar el nuevo sistema de propaganda. Este problema puede enfocarse de la siguiente manera: Se hace la suposición de que las ventas promedio con el nuevo sistema de propaganda es de BsF. 200 como máximo 200 .Esta suposición es lo que se conoce como Hipótesis Estadística1, después de formulada la hipótesis, se determina mediante los resultados de una muestra, si es o no una hipótesis razonable. En este sentido la decisión de implantar o no el nuevo sistema, se reduce a decidir si se rechaza o no la hipótesis planteada. El procedimiento que nos lleva a aceptar o rechazar la hipótesis, es lo que llamamos Contraste de Hipótesis. Para realizar esto, observamos un estadístico cuya distribución muestral se conoce bajo el supuesto de que la hipótesis nula es verdadera. Algunos valores del estadístico pueden llevarnos a sospechar que la hipótesis no es razonable y debe ser rechazada. 1 Una hipótesis estadística, en este caso, es una suposición acerca del valor del parámetro o parámetros desconocidos de la población de interés. 2 Otros valores pueden considerarse justificación de la hipótesis. Sin embargo, la obtención de un valor razonable del estadístico no demuestra que la hipótesis sea verdadera; simplemente no la contradice. Veamos otro ejemplo que nos permitirá ilustrar la naturaleza del contraste de hipótesis: supongamos que cierta compañía de aviación exige al fabricante de sus aparatos que utilice remaches cuya resistencia promedio a la ruptura exceda los 60 kg. Todo productor de remaches que desee venderles a esta compañía, debe demostrar que sus remaches cumplen la especificación requerida es decir, la resistencia promedio a la ruptura de todos los remaches producidos debe ser de mayor que 60 kg 60 . Cada remache tiene una resistencia que se determinará midiendo la fuerza necesaria para romperlo. No se está cuestionando la resistencia de cada remache, sino la resistencia promedio de todos ellos. ¿Cómo puede ser determinada la resistencia promedio? Es claro que no pueden examinarse todos los remaches de hacerse esto, sólo quedarían remaches rotos y ninguno sería útil para fabricar aviones. En consecuencia, se probará una muestra de remaches y se tomará una decisión sobre la resistencia promedio de todos los remaches tomando como base el promedio de los remaches muestreados x . Se establece entonces la aseveración acerca del parámetro de interés y se formulan la Hipótesis Nula (H0) y la Hipótesis Alternativa (H1), examinando la hipótesis estadística hecha planteándose dos afirmaciones opuestas. Por ejemplo: a. “la resistencia media a la ruptura de los remaches es mayor que 60 kg 60 ”, el requisito de la compañía aérea. b. “la resistencia media a la ruptura de los remaches es menor o igual a 60 kg 60 ” Entonces, la afirmación (b) se convierte en la hipótesis nula: H 0 : 60 . Al parámetro de interés, media poblacional, se le asigna un valor especifico. Además 60 kg es el valor en el cual hemos centrado nuestra atención. Esta hipótesis representa el caso opuesto a los deseos del fabricante de los remaches y establece que su producto no satisface los estándares requeridos. En general, consideramos como la Hipótesis Nula aquella que esperamos rechazar o desaprobar. Es claro, que el rechazo de H0 implica la aceptación de la Hipótesis Alternativa H1: 60 . 3 Para realizar el contraste de la Hipótesis Nula formulada, observamos un estadístico cuya distribución muestral es conocida. ESTADÍSTICO DE CONTRASTE: Por lo general es un estimador insesgado y de varianza mínima del parámetro, es el estadístico seleccionado por el investigador para resumir los valores muestrales a un número real de manera de facilitar la toma de decisión mediante la comparación de dicho valor con el valor crítico que genera la Región Crítica o Región de Rechazo. REGIÓN CRÍTICA O REGIÓN DE RECHAZO: Es el conjunto de valores del estadístico de contraste que llevan a la decisión de rechazar o no la Hipótesis Nula. Algunos valores del estadístico pueden llevarnos a sospechar que la hipótesis no es razonable y debe ser rechazada. Otros valores pueden considerarse como justificación de la hipótesis. Sin embargo, la obtención de un valor razonable del estadístico no demuestra que la hipótesis es verdadera, simplemente no la contradice. Su complemento recibe el nombre de Región de Aceptación. VALOR(ES) CRÍTICO(S): Es (son) el (los) punto (s) frontera de la Región Crítica y la Región de Aceptación incluyéndose en esta última. PRUEBA UNILATERAL: Cuando la región de rechazo está localizada en un solo extremo de la curva de la distribución del estadístico de contraste, se dice que la prueba es de una cola o unilateral. PRUEBA BILATERAL: Cuando la región de rechazo está localizada en ambos extremos de la curva de la distribución del estadístico de contraste, se dice que la prueba es de dos colas o bilateral. En el cuadro siguiente se presentan los posibles casos relacionados con la veracidad de la hipótesis nula, H0: DECISIÓN No se rechaza H0 Se rechaza H0 HIPÓTESIS NULA VERDADERA FALSA Decisión Correcta Error Tipo II 1 Error Tipo I Decisión Correcta 1 Sería conveniente que siempre que se tome una decisión ésta resultara correcta. Sin embargo es estadísticamente imposible, puesto que la decisión estará tomada con base en información muestral probabilística. 4 Cuando una hipótesis nula es rechazada o aceptada con base en los resultados muestrales, siempre existe la posibilidad de tomar una decisión equivocada. De ser así, se estaría cometiendo el: a) ERROR TIPO I: Considerado como la probabilidad de rechazar la hipótesis nula siendo verdadera, se denota por y recibe el nombre de NIVEL DE SIGNIFICACIÓN. PError tipo I b) ERROR TIPO II: Considerado como la probabilidad de no rechazar hipótesis nula siendo falsa, se denota por . la PError tipo II En caso contrario, es decir cuando no se tome una decisión equivocada: a) POTENCIA DE UN CONTRASTE: Considerada como la probabilidad de rechazar la hipótesis nula siendo falsa, se denota por 1 . Decisión correcta b) NIVEL DE CONFIANZA: Considerado como la probabilidad de no rechazar la hipótesis nula siendo verdadera, se denota por 1 . Decisión correcta. EN GENERAL: Se dice que una prueba estadística es significativa cuando el resultado de la misma es el rechazo de la hipótesis nula. PROCEDIMIENTO PARA LA REALIZACIÓN DE UN CONTRASTE DE HIPÓTESIS Una vez definida la población, la muestra y el parámetro a investigar, se procede de la siguiente manera: 1. Se enuncian los contenidos de la hipótesis nula y alternativa. 2. Se fija el nivel de significación . 3. Se elige la prueba adecuada mediante definición del estadístico de contraste cuya distribución por muestreo es conocida bajo el supuesto de que H0 es verdadera. 4. Se define la región crítica (zona de rechazo). 5. Se calcula valor del estadístico de contraste. 6. Se toma la decisión: si el valor del estadístico de contraste pertenece a la región crítica, rechace la hipótesis nula. En caso contrario, no rechace la hipótesis nula. Finalmente se elabora la conclusión en términos de la hipótesis alternativa. 5 Ejemplo: a) Si la decisión fue rechazar H0, la conclusión debería enunciarse en la forma siguiente: “existen evidencias muestrales suficientes al nivel de significación elegido , para concluir que el enunciado de la hipótesis alternativa es aceptado”. En el ejemplo de los remaches: “Existen evidencias muestrales suficientes a un 5% de significación, para concluir que la resistencia promedio a la ruptura de los remaches es mayor que 60 kg”. Esto es, se está cumpliendo con lo requerido por la compañía aérea. En este caso, existe la probabilidad de estar cometiendo el Error Tipo I. b) Si la decisión fue no rechazar H0, la conclusión debería enunciarse en la forma siguiente: “no existen evidencias muestrales suficientes al nivel de significación elegido para concluir que el enunciado de la hipótesis alternativa es rechazado”. En el ejemplo de los remaches: “no existen evidencias muestrales suficientes a un 5% de significación, para concluir que la resistencia promedio a la ruptura de los remaches es mayor que 60 kg”. Esto es, no se está cumpliendo con lo requerido por la compañía aérea. En este caso, existe la probabilidad de cometer el Error Tipo II. CONTRASTE DE HIPÓTESIS PARA LA MEDIA POBLACIONAL CON VARIANZA CONOCIDA, POBLACIÓN NORMAL O MUESTRA GRANDE SISTEMA DE HIPÓTESIS H 0 : 0 ESTADÍSTICO DE CONTRASTE Z * Z H1 : 0 H 0 : 0 H1 : 0 H 0 : 0 H1 : 0 RECHAZO DE H0 SI: Z* 2 o Z * Z 2 x 0 n Z * Z Z * Z 6 CONTRASTE DE HIPÓTESIS PARA LA MEDIA POBLACIONAL CON VARIANZA DESCONOCIDA, POBLACIÓN APROXIMADAMENTE NORMAL Y MUESTRA PEQUEÑA. SISTEMA DE HIPÓTESIS H 0 : 0 H1 : 0 H 0 : 0 H1 : 0 ESTADÍSTICO DE CONTRASTE RECHAZO DE H0 SI: t t n1; x 0 t s n t t n 1; H1 : 0 CONTRASTE DE HIPÓTESIS POBLACIONALES 1 2 . MUESTRAS INDEPENDIENTES VARIANZAS CONOCIDAS H 0 : 1 2 H1 : 1 2 H 0 : 1 2 H1 : 1 2 2 t t n1; H 0 : 0 SISTEMA DE HIPÓTESIS H 0 : 1 2 H1 : 1 2 o t tn1; 2 PARA LA ESTADÍSTICO DE CONTRASTE Z* x1 x2 1 2 12 n1 22 DIFERENCIA DE MEDIAS RECHAZO DE H0 SI: Z * Z 2 o Z * Z 2 Z * Z n1 Z * Z CONTRASTE DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL P . SISTEMA DE HIPÓTESIS H 0 : P P0 H 1 : P P0 H 0 : P P0 H 1 : P P0 H 0 : P P0 H 1 : P P0 ESTADÍSTICO DE CONTRASTE Z* p P0 P0 Q0 n RECHAZO DE H0 SI: Z * Z 2 o Z * Z 2 Z * Z Z * - Z 7 CONTRASTE DE HIPÓTESIS PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES P1 P2 . SISTEMA DE HIPÓTESIS H 0 : P1 P2 H1 : P1 P2 H 0 : P1 P2 ESTADÍSTICO DE CONTRASTE Z* H1 : P1 P2 p1 p2 P1 P2 P1Q1 P2Q2 n1 n2 RECHAZO DE H0 SI: Z * Z 2 o Z * Z 2 Z * Z Si P1 P2 Q1 Q2 H 0 : P1 P2 H1 : P1 P2 Z* p p1 p2 1 1 PQ n1 n2 Z * - Z x1 x2 n1 p1 n2 p2 n1 n2 n1 n2 PRUEBA DE INDEPENDENCIA PARA TABLAS DE CONTINGENCIA. SISTEMA DE HIPÓTESIS de H 0 : Criterios clasificación son independientes H 1 : Criterios de clasificación no son independientes ESTADÍSTICO DE CONTRASTE 2 f0 fe 2 cal fe 2 cal f 02 N fe RECHAZO DE H0 SI: 2 cal 2 , f 1c 1 8