Download UNIVERSIDAD CENTRAL DE VENEZUELA

Document related concepts
no text concepts found
Transcript
UNIVERSIDAD CENTRAL DE VENEZUELA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ESCUELA DE SOCIOLOGÍA
DEPARTAMENTO DE ESTADÍSTICA
INFERENCIA ESTADÍSTICA
ANOTACIONES SOBRE CONSTRASTE DE HIPÓTESIS
Prof. Simón Cabrera
Prof. Edmundo Pardo
Septiembre, 2011
NATURALEZA DEL CONTRASTE DE HIPÓTESIS
Un contraste de hipótesis también denominado test de hipótesis o prueba de
significación, es una metodología de inferencia estadística para juzgar si una
propiedad que se supone cumple una población estadística, es compatible con lo
observado en una muestra aleatoria de dicha población.
Mediante esta teoría, se aborda el problema estadístico, considerando una
hipótesis determinada H0 y una hipótesis alternativa H1 y se busca dirimir cuál de
las dos es la hipótesis verdadera, tras aplicar el problema estadístico a un cierto
número de experimentos.
El contraste está fuertemente asociado a los considerados errores de tipo I y II en
estadística, que definen respectivamente, la posibilidad de tomar un suceso
verdadero como falso o uno falso como verdadero. La utilidad del contraste de
hipótesis proviene del hecho de constituir uno de los instrumentos más apropiados
para tomar decisiones en condiciones de incertidumbre.
Por ejemplo, supongamos que una empresa está estudiando la posibilidad de
implantar un nuevo sistema de propaganda para aumentar las ventas promedio
por cliente. Con el sistema de propaganda actual, las ventas promedio por cliente
son de BsF. 200. El nuevo sistema de propaganda supone un incremento en los
costos, que se estima conveniente, si las ventas promedio por cliente aumentan.
El problema de toma de decisiones a que se enfrenta la empresa es uno con dos
posibles acciones:
a. Implantar el nuevo sistema de propaganda.
b. No implantar el nuevo sistema de propaganda.
Este problema puede enfocarse de la siguiente manera: Se hace la suposición de
que las ventas promedio con el nuevo sistema de propaganda es de BsF. 200
como máximo   200 .Esta suposición es lo que se conoce como Hipótesis
Estadística1, después de formulada la hipótesis, se determina mediante los
resultados de una muestra, si es o no una hipótesis razonable. En este sentido la
decisión de implantar o no el nuevo sistema, se reduce a decidir si se rechaza o
no la hipótesis planteada.
El procedimiento que nos lleva a aceptar o rechazar la hipótesis, es lo que
llamamos Contraste de Hipótesis. Para realizar esto, observamos un estadístico
cuya distribución muestral se conoce bajo el supuesto de que la hipótesis nula es
verdadera. Algunos valores del estadístico pueden llevarnos a sospechar que la
hipótesis no es razonable y debe ser rechazada.
1
Una hipótesis estadística, en este caso, es una suposición acerca del valor del parámetro o parámetros
desconocidos de la población de interés.
2
Otros valores pueden considerarse justificación de la hipótesis. Sin embargo, la
obtención de un valor razonable del estadístico no demuestra que la hipótesis sea
verdadera; simplemente no la contradice.
Veamos otro ejemplo que nos permitirá ilustrar la naturaleza del contraste de
hipótesis: supongamos que cierta compañía de aviación exige al fabricante de sus
aparatos que utilice remaches cuya resistencia promedio a la ruptura exceda los
60 kg.
Todo productor de remaches que desee venderles a esta compañía, debe
demostrar que sus remaches cumplen la especificación requerida es decir, la
resistencia promedio a la ruptura de todos los remaches producidos debe ser de
mayor que 60 kg   60 .
Cada remache tiene una resistencia que se determinará midiendo la fuerza
necesaria para romperlo. No se está cuestionando la resistencia de cada remache,
sino la resistencia promedio de todos ellos.
¿Cómo puede ser determinada la resistencia promedio?
Es claro que no pueden examinarse todos los remaches de hacerse esto, sólo
quedarían remaches rotos y ninguno sería útil para fabricar aviones. En
consecuencia, se probará una muestra de remaches y se tomará una decisión
sobre la resistencia promedio de todos los remaches   tomando como base el
promedio de los remaches muestreados x  .
Se establece entonces la aseveración acerca del parámetro de interés y se
formulan la Hipótesis Nula (H0) y la Hipótesis Alternativa (H1), examinando la
hipótesis estadística hecha planteándose dos afirmaciones opuestas.
Por ejemplo:
a. “la resistencia media a la ruptura de los remaches es mayor que 60 kg
  60 ”, el requisito de la compañía aérea.
b. “la resistencia media a la ruptura de los remaches es menor o igual a 60 kg
  60 ”
Entonces, la afirmación (b) se convierte en la hipótesis nula: H 0 :   60 . Al
parámetro de interés, media poblacional, se le asigna un valor especifico. Además
60 kg es el valor en el cual hemos centrado nuestra atención. Esta hipótesis
representa el caso opuesto a los deseos del fabricante de los remaches y
establece que su producto no satisface los estándares requeridos. En general,
consideramos como la Hipótesis Nula aquella que esperamos rechazar o
desaprobar. Es claro, que el rechazo de H0 implica la aceptación de la Hipótesis
Alternativa H1:   60 .
3
Para realizar el contraste de la Hipótesis Nula formulada, observamos un
estadístico cuya distribución muestral es conocida.

ESTADÍSTICO DE CONTRASTE: Por lo general es un estimador
insesgado y de varianza mínima del parámetro, es el estadístico
seleccionado por el investigador para resumir los valores muestrales a un
número real de manera de facilitar la toma de decisión mediante la
comparación de dicho valor con el valor crítico que genera la Región
Crítica o Región de Rechazo.

REGIÓN CRÍTICA O REGIÓN DE RECHAZO: Es el conjunto de valores
del estadístico de contraste que llevan a la decisión de rechazar o no la
Hipótesis Nula. Algunos valores del estadístico pueden llevarnos a
sospechar que la hipótesis no es razonable y debe ser rechazada. Otros
valores pueden considerarse como justificación de la hipótesis. Sin
embargo, la obtención de un valor razonable del estadístico no demuestra
que la hipótesis es verdadera, simplemente no la contradice. Su
complemento recibe el nombre de Región de Aceptación.

VALOR(ES) CRÍTICO(S): Es (son) el (los) punto (s) frontera de la Región
Crítica y la Región de Aceptación incluyéndose en esta última.

PRUEBA UNILATERAL: Cuando la región de rechazo está localizada en
un solo extremo de la curva de la distribución del estadístico de contraste,
se dice que la prueba es de una cola o unilateral.

PRUEBA BILATERAL: Cuando la región de rechazo está localizada en
ambos extremos de la curva de la distribución del estadístico de contraste,
se dice que la prueba es de dos colas o bilateral.
En el cuadro siguiente se presentan los posibles casos relacionados con la
veracidad de la hipótesis nula, H0:
DECISIÓN
No se rechaza H0
Se rechaza H0
HIPÓTESIS NULA
VERDADERA
FALSA
Decisión Correcta
Error Tipo II
1   
 
Error Tipo I
Decisión Correcta
 
1   
Sería conveniente que siempre que se tome una decisión ésta resultara correcta.
Sin embargo es estadísticamente imposible, puesto que la decisión estará tomada
con base en información muestral probabilística.
4
Cuando una hipótesis nula es rechazada o aceptada con base en los resultados
muestrales, siempre existe la posibilidad de tomar una decisión equivocada. De
ser así, se estaría cometiendo el:
a) ERROR TIPO I: Considerado como la probabilidad de rechazar la hipótesis
nula siendo verdadera, se denota por  y recibe el nombre de NIVEL DE
SIGNIFICACIÓN.
PError tipo I   
b) ERROR TIPO II: Considerado como la probabilidad de no rechazar
hipótesis nula siendo falsa, se denota por  .
la
PError tipo II   
En caso contrario, es decir cuando no se tome una decisión equivocada:
a) POTENCIA DE UN CONTRASTE: Considerada como la probabilidad de
rechazar la hipótesis nula siendo falsa, se denota por 1    . Decisión
correcta
b) NIVEL DE CONFIANZA: Considerado como la probabilidad de no rechazar
la hipótesis nula siendo verdadera, se denota por 1    . Decisión correcta.
EN GENERAL: Se dice que una prueba estadística es significativa cuando el
resultado de la misma es el rechazo de la hipótesis nula.
PROCEDIMIENTO PARA LA REALIZACIÓN DE UN CONTRASTE DE
HIPÓTESIS
Una vez definida la población, la muestra y el parámetro a investigar, se procede
de la siguiente manera:
1. Se enuncian los contenidos de la hipótesis nula y alternativa.
2. Se fija el nivel de significación   .
3. Se elige la prueba adecuada mediante definición del estadístico de
contraste cuya distribución por muestreo es conocida bajo el supuesto
de que H0 es verdadera.
4. Se define la región crítica (zona de rechazo).
5. Se calcula valor del estadístico de contraste.
6. Se toma la decisión: si el valor del estadístico de contraste pertenece a
la región crítica, rechace la hipótesis nula. En caso contrario, no rechace
la hipótesis nula.
Finalmente se elabora la conclusión en términos de la hipótesis alternativa.
5
Ejemplo:
a) Si la decisión fue rechazar H0, la conclusión debería enunciarse en la
forma siguiente: “existen evidencias muestrales suficientes al nivel de
significación elegido   , para concluir que el enunciado de la hipótesis
alternativa es aceptado”. En el ejemplo de los remaches: “Existen
evidencias muestrales suficientes a un 5% de significación, para
concluir que la resistencia promedio a la ruptura de los remaches
es mayor que 60 kg”. Esto es, se está cumpliendo con lo requerido por
la compañía aérea. En este caso, existe la probabilidad de estar
cometiendo el Error Tipo I.
b) Si la decisión fue no rechazar H0, la conclusión debería enunciarse en
la forma siguiente: “no existen evidencias muestrales suficientes al nivel
de significación elegido   para concluir que el enunciado de la
hipótesis alternativa es rechazado”. En el ejemplo de los remaches: “no
existen evidencias muestrales suficientes a un 5% de significación,
para concluir que la resistencia promedio a la ruptura de los
remaches es mayor que 60 kg”. Esto es, no se está cumpliendo con
lo requerido por la compañía aérea. En este caso, existe la probabilidad
de cometer el Error Tipo II.
CONTRASTE DE HIPÓTESIS PARA LA MEDIA POBLACIONAL   CON
VARIANZA CONOCIDA, POBLACIÓN NORMAL O MUESTRA GRANDE
SISTEMA DE
HIPÓTESIS
H 0 :   0
ESTADÍSTICO DE
CONTRASTE
Z *  Z
H1 :    0
H 0 :    0  
H1 :    0
H 0 :    0 
H1 :    0
RECHAZO DE H0
SI:
Z* 
2
o Z *  Z
2
x  0

n
Z *  Z
Z *   Z
6
CONTRASTE DE HIPÓTESIS PARA LA MEDIA POBLACIONAL   CON
VARIANZA DESCONOCIDA, POBLACIÓN APROXIMADAMENTE NORMAL Y
MUESTRA PEQUEÑA.
SISTEMA DE
HIPÓTESIS
H 0 :   0
H1 :    0
H 0 :    0  
H1 :    0
ESTADÍSTICO DE
CONTRASTE
RECHAZO DE H0
SI:
t  t n1;
x  0
t
s
n
t  t n 1;
H1 :    0
CONTRASTE DE HIPÓTESIS
POBLACIONALES 1   2  .
MUESTRAS INDEPENDIENTES
VARIANZAS CONOCIDAS
H 0 : 1   2  
H1 : 1   2
H 0 : 1   2  
H1 : 1   2
2
t  t n1;
H 0 :    0  
SISTEMA DE
HIPÓTESIS
H 0 : 1   2
H1 : 1   2
o t  tn1;
2
PARA
LA
ESTADÍSTICO DE
CONTRASTE
Z* 
x1  x2   1  2 
 12
n1

 22
DIFERENCIA
DE
MEDIAS
RECHAZO DE H0 SI:
Z *  Z 
2
o Z *  Z
2
Z *  Z
n1
Z *   Z
CONTRASTE DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL P .
SISTEMA DE
HIPÓTESIS
H 0 : P  P0
H 1 : P  P0
H 0 : P  P0  
H 1 : P  P0
H 0 : P  P0  
H 1 : P  P0
ESTADÍSTICO DE
CONTRASTE
Z* 
p  P0
P0 Q0
n
RECHAZO DE H0 SI:
Z *  Z 
2
o Z *  Z
2
Z *  Z
Z *  - Z
7
CONTRASTE DE HIPÓTESIS PARA LA DIFERENCIA DE PROPORCIONES
POBLACIONALES P1  P2  .
SISTEMA DE
HIPÓTESIS
H 0 : P1  P2
H1 : P1  P2
H 0 : P1  P2  
ESTADÍSTICO DE
CONTRASTE
Z* 
H1 : P1  P2
 p1  p2   P1  P2 
P1Q1 P2Q2

n1
n2
RECHAZO DE H0 SI:
Z *  Z
2
o Z *  Z
2
Z *  Z
Si P1  P2  Q1  Q2
H 0 : P1  P2  
H1 : P1  P2
Z* 
p
p1  p2
1 1
PQ  
 n1 n2 
Z *  - Z
x1  x2 n1 p1  n2 p2

n1  n2
n1  n2
PRUEBA DE INDEPENDENCIA PARA TABLAS DE CONTINGENCIA.
SISTEMA DE
HIPÓTESIS
de
H 0 : Criterios
clasificación
son
independientes
H 1 : Criterios de
clasificación no son
independientes
ESTADÍSTICO DE
CONTRASTE
2

f0  fe 
2
 cal  
fe
2
 cal

f 02
N
fe
RECHAZO DE H0 SI:
2
 cal
  2 ,
   f  1c  1
8