Download PRUEBAS DE HIPÓTESIS CON MUESTRAS GRANDES

Document related concepts
no text concepts found
Transcript
Probabilidad y Estadística
Pruebas de hipótesis
11
PRUEBAS DE HIPÓTESIS CON MUESTRAS GRANDES
INTRODUCCIÓN.
Recordemos que el objetivo de la estadística inferencial es conocer características de la población a
partir de la información contenida en una muestra. En particular, se hacen inferencias acerca de los
parámetros poblacionales desconocidos, basadas en la información contenida en una muestra.
En Estadística Inferencial hay dos formas de realizar inferencias acerca de un parámetro poblacional:
podemos estimar su valor que es lo que vimos la clase pasada, o bien, probar (o comprobar) una hipótesis
acerca de su valor, que es lo que vamos ver esta clase.
En la clase pasada vimos dos tipos de estimaciones:
Puntual: En este caso para estimar el valor de un parámetro poblacional , usamos un estimador puntual

insesgado 



y podemos calcular la probabilidad de que P(|   | < c) que es una medida del error que cometemos al usar

 para estimar .
Por intervalo: En este caso para estimar el valor de un parámetro poblacional , usamos un estimador puntual

insesgado, como  para determinar un intervalo


[  c   ,  + c   ]

donde   es la desviación estándar de la distribución muestral de  .
En particular, si z/2 es tal que P(z/2 < z ) = /2,
o equivalentemente,
P(0 < z < z/2) = (1  
entonces


[  z/2   ,  + z/2   ] es un intervalo de confianza de 1.
es decir,


P([  z/2   ,  + z/2   ] contenga a ) =1.

Para calcular las probabilidades anteriores, se usa la distribución muestral de  . Se supuso que se
trabajaba con muestras grandes para que esta distribución fuera aproximadamente normal.

Hoy vamos a ver como se puede realizar una inferencia acerca de un parámetro poblacional
probando (o comprobando) una hipótesis acerca de su valor. Veamos algunos ejemplos en donde se puede
usar una prueba de hipótesis:

Un investigador en medicina propone la hipótesis de que un medicamento A es más efectivo que otro
B para curar una cierta enfermedad.

Un técnico de control de calidad propone la hipótesis de que un nuevo método de montaje produce
sólo 5% de artículos defectuosos.

Un educador afirma que dos métodos para enseñar tiene la misma eficacia.

Un candidato político afirma que la mayoría de los votantes están de su parte.
En todos estos casos la hipótesis o afirmación se somete a una prueba estadística para compararla
con los resultados de los datos muestrales. Vamos a ver:

Qué función de las mediciones muestrales debe utilizarse para realizar la prueba.

Cómo se decide si una muestra no concuerda con la hipótesis

Cuándo debe rechazarse la hipótesis, aceptarse la hipótesis o no decidir nada acerca de la hipótesis.

Cuál es la probabilidad de tomar una decisión equivocada.
Probabilidad y Estadística
Pruebas de hipótesis
12
______________________________________________________________________
ELEMENTOS DE UNA PRUEBA DE HIPÓTESIS
El objetivo de toda prueba de hipótesis es probar una hipótesis acerca del valor de un parámetro
poblacional. Entonces el primer elemento de la prueba de hipótesis es la afirmación o hipótesis sobre el valor
de uno o más parámetros poblacionales y recibe el nombre de hipótesis alternativa.
Hipótesis alternativa, Ha: afirmación o hipótesis sobre el valor de uno o más parámetros poblacionales. Se
denota con Ha.
El segundo elemento es la hipótesis nula que es una negación de la hipótesis alternativa.
Hipótesis nula, H0: negación de la hipótesis alternativa.
El soporte para la validez de la hipótesis alternativa Ha se obtiene mostrando, usando los valores
muestrales como evidencia, que la hipótesis nula H0 es falsa. Así el soporte de una hipótesis se obtiene
mostrando la falta de soporte para la otra.
Ejemplo. a) Se cree que no más del 50% de los consumidores prefiere un producto de marca A.
Se propone como hipótesis alternativa que la proporción p de consumidores que prefieren la marca A es
mayor que 50% = 0.5
Ha: p > 0.5
Se propone además
H0: p = 0.5
La decisión de rechazar H0 y de aceptar Ha, se basa en la información contenida en una muestra de n
mediciones, tomadas de una población.
b) Se seleccionan 100 consumidores y se les pregunta si prefieren la marca A.
En este caso la muestra se extrae de una población binomial con parámetro p.
En función de los datos de una muestra se obtiene un número llamando la estadística de prueba (que puede
ser un estimador).
c) Por ejemplo, se obtiene x la cantidad de consumidores que prefieren A de los 100 de la muestra.
El conjunto de todos los valores que puede tomar la estadística de prueba se divide en dos
subconjuntos o regiones:
región de rechazo
región de aceptación
Si la estadística cae en la región de rechazo, se rechaza H0 a favor de Ha.
Si la estadística cae en la región de aceptación, se acepta H0.
La región de rechazo debe contener valores que apoyen Ha.
d) Como 0  x  100, es decir, x  [0, 100], Ha: p > 0.5 y H0: p = 0.5 se podría tener
región de rechazo: [60, 100]
región de aceptación: [0, 60)
(observar que la región de rechazo contiene valores  60 que apoyan Ha).
Supongamos que x = 99. Como x está en la región de rechazo, rechazamos H0 a favor de Ha y
concluimos que la proporción p de consumidores que prefieren la marca A es mayor a 0.5.
En general, la región de rechazo incluye valores de x que apoyan Ha . En ese ejemplo, Ha: p > 0.5,
por lo tanto la región de rechazo incluye valores de x grandes, que son los que hacen poco probable que p 
0.5.
La región de aceptación y que por lo tanto apoya H0 incluye entonces valores de x chicos. Más allá
Probabilidad y Estadística
Pruebas de hipótesis
13
de estas consideraciones, la determinación de las regiones de rechazo y aceptación depende de la
probabilidad de cometer errores con la que se quiera trabajar. Antes de ver esto, resumamos cuales son los
elementos de una prueba de hipótesis.
Resumiendo
Elementos de una prueba estadística.
1. Hipótesis alternativa.
2. Hipótesis nula.
3. Estadística de prueba.
4. Región de rechazo.
Analicemos los errores que se pueden cometer al aceptar o rechazar H0, cuales son las probabilidades
de cometer cada uno de ellos y como se usa esto para determinar las regiones de rechazo y aceptación.
La hipótesis nula H0 puede ser verdadera o falsa, cosa que no conocemos.
Si H0 es verdadera y la rechazamos se comete un error llamado de tipo I.
Si H0 es falsa y la aceptamos se comete un error llamado de tipo II.
Tabla de decisiones.
Decisión
Rechazar H0
Aceptar H0
Verdadera
Error tipo I
Decisión correcta
Hipótesis nula
Falsa
Decisión correcta
Error tipo II
La validez o bondad de una prueba de hipótesis se mide mediante las probabilidades de cometer cada
uno de estos errores
 probabilidad de cometer un error de tipo I
 probabilidad de cometer un error de tipo II
 corresponde a la región de rechazo.
 corresponde a la región de aceptación.
Volvamos al ejemplo que estábamos considerando.
Ejemplo. Sea p la proporción de consumidores que prefieren la marca A.
a)
Ha: p > 0.5
H0: p = 0.5
b)
Se seleccionan 100 consumidores y se les pregunta si prefieren la marca A.
En este caso la muestra se extrae de una población binomial con parámetro p.
c)
Estadística de prueba: x la cantidad de consumidores que prefieren A de los 100 de la
muestra.
Error tipo I:
Supongamos que H0 es verdadera, es decir, se cumple que p = 0.5. Entonces se puede cometer un
error tipo I, cuando se rechaza H0. Veamos como se calcula .
Como H0 es verdadera, x tiene una distribución binomial con parámetro p = 0.5. Como el tamaño n =
100 de la muestra es grande se puede suponer normal con
x = n p = 100 (0.5) = 50
x =
npq = 100(0.5)(1  0.5) = 5
Probabilidad y Estadística
Pruebas de hipótesis
14
Si se define como
región de rechazo: x   + 2 = 60,
la probabilidad de cometer un error tipo I, es decir de rechazar H0 siendo esta verdadera es
 = P( x  60 ) = 0.025.
Es decir x caerá en la región de rechazo 2.5% de las veces, cometiéndose un error al rechazar H0
siendo verdadera. Vemos además que el valor de  queda fijo al fijar la región de rechazo.
Error tipo II:
Supongamos que H0 es falsa, es decir, se cumple que p  0.5. Entonces se puede cometer un error
tipo II.
Como H0 es falsa, x tiene una distribución binomial con parámetro p desconocido. Como el tamaño n
= 100 de la muestra es grande se puede suponer normal con
 = n p = 100 p
 = npq = 100 p(1  p)
Aunque sabemos que la distribución de x es normal, como desconocemos p no es imposible calcular la
probabilidad de x que caiga en un determinado intervalo, y por ende .
Sin embargo, podemos ver como se comporta  de acuerdo a si p se encuentra cerca o lejos del valor
estipulado en H0, que es 0.5.
Probabilidad y Estadística
Pruebas de hipótesis
15
Si p = 0.9, en la muestra de 100 consumidores casi la totalidad estará a favor de la marca A, con lo
cual x estaría bastante cerca de 100. De este modo, tendríamos una evidencia muy fuerte para rechazar H 0: p
= 0.5, y por ende de no equivocarnos. Es decir,  en este caso es chico.
Si p = 0.55, en la muestra de 100 consumidores casi la mitad estaría a favor de la marca A. De este
modo, tendríamos evidencia como para aceptar H0: p = 0.5, y por ende de equivocarnos. Es decir,  en este
caso es grande.
En definitiva, mientras mayor sea la diferencia entre p real y el que propone H 0, menor es
probabilidad de cometer un error tipo II, es decir, menor es .
Relación entre los dos tipos de errores.
 corresponde a la región de rechazo.
 corresponde a la región de aceptación.
Mientras más grande (chica) es la región de rechazo más chica (grande) es la región de aceptación.
Si  crece (disminuye) entonces  disminuye (crece).
En general se tiene,
Propiedades de  y 
1. El valor de  se fija al escoger la región de rechazo.
2. El valor de  dependerá del valor que se use para definir H0.
Mientras más grande (chica) sea la diferencia entre el valor que se use para definir H 0 y el valor real del
parámetro, menor (mayor) será .
3. Si  crece (disminuye) entonces  disminuye (crece).
4. Si se aumenta el tamaño de la muestra  y  disminuyen.
Al idear una prueba de hipótesis se consideran los valores  y  que se quieren tolerar. Los pasos
que se suelen seguir son:
1. Se especifica .
2. En función de , se determina la región de rechazo.
3. Se selecciona un tamaño n de muestra para lograr un  adecuado.
El último paso es el que en general no se puede llevar a cabo porque es necesario conocer los
distintos valores de  para diferentes valores del parámetro en prueba. En la práctica, si la estadística de
prueba cae en la región de rechazo, podemos cometer un error tipo I y sabemos cual es la probabilidad  de
cometerlo. Si la estadística de prueba cae en la región de aceptación, con lo cual se está en riesgo de cometer
un error de tipo II, no se toma decisión alguna y se recolectan más datos.
___________________________________________________________________________
PRUEBA ESTADÍSTICA PARA MUESTRAS GRANDES
Ahora enunciaremos lo anterior, que se vio para un ejemplo concreto (parámetro p de una población
binomial), de modo general.
Recordemos que una estadística de prueba es un número que se obtiene en función de los datos de
una muestra. Se puede usar como estadística de prueba un estimador puntual insesgado que tenga una
distribución de muestreo aproximadamente normal para tamaños grandes de muestra como los que vimos la
clase pasada:
 La media muestral x es un estimador insesgado de la media poblacional .
 La proporción muestral p̂ es un estimador insesgado del parámetro p.


x 1  x 2 es un estimador insesgado del parámetro 1  2.
p̂ 1  p̂ 2 es un estimador insesgado del parámetro p1  p2.


En general, sea  es un estimador insesgado de un parámetro  . Se supone que  es un estimador
insesgado que tiene una distribución de muestreo aproximadamente normal.
Probabilidad y Estadística
Pruebas de hipótesis
16
Supongamos que se quiere probar que el parámetro poblacional  es mayor que un cierto valor 0, es
decir
Ha:  > 0
Se propone entonces como hipótesis nula
H0:  = 0


Estadístico de prueba: 

La región de rechazo debe contener valores de  que apoyen Ha,  > 0. Así se elige un C > 0, y se define

región de rechazo: {  > 0 + C}.
0 + C valor crítico de la estadística de prueba (separa la región de rechazo de la región de prueba).

Si se quiere probar que el parámetro poblacional  es menor que un cierto valor 0,
Ha:  < 0
H0:  = 0

Estadístico de prueba: 

La región de rechazo debe contener valores de  que apoyen Ha,  < 0.

región de rechazo: {  < 0  C}
En ambos casos se dice que es una prueba estadística de una extremidad o cola pues la región de
rechazo se localiza en un sólo extremo de la distribución muestral de la estadística de prueba.

Si se quiere probar que el parámetro poblacional  es distinto de cierto valor 0, se tendría
Ha:   0
H0:  = 0

Estadístico de prueba: 


región de rechazo: {  < 0  C} o {  > 0 + C}
y se dice que es una prueba estadística de dos extremidades o colas pues la región de rechazo se localiza en
ambos extremos de la distribución muestral de la estadística de prueba.
Probabilidad  de un error tipo I.

Es la probabilidad de que  caiga en la región de rechazo siendo H0 verdadera. Luego es el área,

correspondiente a la región de rechazo, bajo la curva de la distribución muestral de  , que es normal con
media  = 0 y desviación estándar  ˆ . En el caso de una prueba de dos colas, a cada mitad de la región le
corresponde una probabilidad  / 2.
Ha:  > 0,
Para pruebas de una cola:


P({  < 0  C}) = 
P({  > 0 + C}) = 
(ver Figura 7.3, p. 243)
Ha:  < 0,
Para pruebas de dos colas: Ha:   0




P({  < 0  C}  {  > 0 + C}) = P({  < 0  C}) + P({  > 0 + C}) =  


P({  < 0  C}) = P({  > 0 + C}) = /2
Probabilidad  de un error tipo II.

(ver Figura 7.4, p. 243)
Es la probabilidad de que  caiga en la región de aceptación siendo H0 falsa.
Supongamos que H0 es falsa y que en realidad  = a siendo a desconocido. Luego la distribución

muestral de  , es normal con media a y desviación estándar  ˆ .
Con esta distribución de probabilidad se tiene (ver Figura 7.5, p. 244)
Para pruebas de una cola:
Ha:  > 0,
Ha:  < 0,


P({  > 0  C}) = 

P({  < 0 + C}) = 
Para pruebas de dos colas: Ha:   0, P({0  C <  < 0 + C}) = 
Probabilidad y Estadística
Pruebas de hipótesis
17
(ya no hay simetría respecto a 0, sino respecto a a).

Si se utiliza como estadístico de prueba la variable
z=
ˆ   0
 ˆ

que es la desviación de una variable aleatoria  , respecto a 0, expresada en unidades de  ˆ .
si
 = P(error tipo I),
se pueden reescribir las pruebas anteriores como
Prueba estadística para muestras grandes
1. Hipótesis nula. H0:  = 0.
2. Hipótesis alternativa.
Prueba de una extremidad (o cola) Ha:  > 0 ( < 0)
Prueba de dos extremidades (o colas) Ha:  0.
3. Estadística de prueba. z =
ˆ   0
 ˆ
4. Región de rechazo.
Prueba de una extremidad (o cola):z > z (z < z)
z es tal que P(z > z) = P(z < z) = .
Prueba de dos extremidades (o cola): z > z/2 o z < z/.
z/2 es tal que P(z > z/2) = P(z < z/2) = /2.
(ver figuras del recuadro p. 245)
Suposición: Se seleccionó una muestra aleatoria de tamaño grande n ( 30).
En particular se tiene
___________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
Prueba estadística para  en el caso de muestras grandes
1. Hipótesis nula. H0:  = 0.
2. Hipótesis alternativa.
Prueba de una extremidad (o cola) Ha: > 0 ( < 0)
Prueba de dos extremidades (o cola) Ha:  0.
3. Estadística de prueba. z =
x  0
x
=
x  0
/ n
Si no se conoce  se sustituye por s.
4. Región de rechazo.
Prueba de una extremidad (o cola):z > z (z < z)
z es tal que P(z > z) = P(z < z) = .
Prueba de dos extremidades (o cola): z > z/2 o z < z/.
z/2 es tal que P(z > z/2) = P(z < z/2) = /2.
Suposición: Se seleccionó una muestra aleatoria de tamaño n  30.
Probabilidad y Estadística
Pruebas de hipótesis
18
Ejemplo. La producción diaria de una planta industrial química registrada durante n = 50 días tiene una
media x = 871 toneladas y una desviación estándar s = 21 toneladas.
(a) Probar la hipótesis de que el promedio de la producción diaria es  = 880 toneladas por día contra la
alternativa de que  es mayor o menor a 880 toneladas por día.
Hipótesis nula. H0:  = 880.
Hipótesis alternativa.
Prueba de dos extremidades (o cola) Ha:  880.
Estadística de prueba. z =
x  0
/ n
=
x  880
 / 50

x  880
=
s / 50
x  880

21 / 50
x  880
2.97
Región de rechazo.
Prueba de dos extremidades (o cola): z > z/2 o z < z/.
Si se quiere  = 0.05, entonces z/ = 1.96. Luego
Región de rechazo. z > 1.96 o z < 1.96 (ver Figura 7.6, p. 246)
Como x = 871, entonces z = 3.03 que cae en la región de rechazo. Así rechazamos que el
promedio de la producción diaria es  = 880 toneladas por día y la probabilidad de equivocarnos es de 5%.
Si usáramos intervalos de confianza tendríamos que el intervalo
x  z/ / n  871  5.82
tiene un coeficiente de confianza 1   = 0.95 = 95%. Hay un 95% de probabilidad de que este intervalo
contenga a . Entonces rechazaríamos  = 880 pues no cae en este intervalo.
Como x = 871 < 880, se sospecharía que en realidad  < 880.
(b) ¿Cuál es la probabilidad  de aceptar H0 si el valor real de  fuera 870 toneladas?.
Región de aceptación.
z  1.96
x  880
21 / 50
 1.96
( x  880) 
21
x 
1.96
50
21
1.96 + 880
50
x de 874.18 a 885.82
 es el área, correspondiente a la región de aceptación, bajo la curva normal que tiene
media  = 870
desviación estándar  x =
21
= 2.97
50
 = 0.0793 (ver Figura 7.7, p. 247)
Así si  fuera en realidad 870 toneladas, la probabilidad  de aceptar H0:  = 880 es 7.9%.
________________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS MEDIAS POBLACIONALES
Prueba estadística para 1  2 en el caso de muestras grandes
1. Hipótesis nula. H0: 1  2 = D0.
2. Hipótesis alternativa.
Prueba de una extremidad (o cola) Ha:1  2 > D0 (1  2 < D0)
Prueba de dos extremidades (o cola) Ha:1  2  D0.
Probabilidad y Estadística
3. Estadística de prueba. z =
Pruebas de hipótesis
x 1  x 2  D0
 x x
1
=
19
x 1  x 2  D0
2
 12
n1

 22
n2
Si no se conocen 1 y 2 se sustituyen por s1 y s2.
4. Región de rechazo.
Prueba de una extremidad (o cola):z > z (z < z)
z es tal que P(z > z) = P(z < z) = .
Prueba de dos extremidades (o cola): z > z/2 o z < z/.
z/2 es tal que P(z > z/2) = P(z < z/2) = /2.
Suposición: Los dos muestreos son aleatorios e independientes de tamaños n1  30 y n2  30.
___________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL
Prueba estadística para p en el caso de muestras grandes
1. Hipótesis nula. H0: p = p0.
2. Hipótesis alternativa.
Prueba de una extremidad (o cola) Ha: p > p0 (p < p0)
Prueba de dos extremidades (o cola) Ha: p  p0.
3. Estadística de prueba. z =
pˆ  p 0
 pˆ
=
pˆ  p 0
p0 q0
n
4. Región de rechazo.
Prueba de una extremidad (o cola):z > z (z < z)
z es tal que P(z > z) = P(z < z) = .
Prueba de dos extremidades (o cola): z > z/2 o z < z/.
z/2 es tal que P(z > z/2) = P(z < z/2) = /2.
Suposición: El muestreo aleatorio satisface las características de un experimento binomial y el tamaño de la
muestra n  30.
___________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES POBLACIONALES
Prueba estadística para p1  p2 en el caso de muestras grandes
1. Hipótesis nula. H0: p1  p2 = D0.
2. Hipótesis alternativa.
Prueba de una extremidad (o cola) Ha: p1  p2 > D0 (p1  p2 < D0)
Prueba de dos extremidades (o cola) Ha: p1  p2  D0.
3. Estadística de prueba. z =
pˆ 1  pˆ 2  D0
 pˆ  pˆ
1
2
=
pˆ 1  pˆ 2  D0
p1 q1 p 2 q 2

n1
n2
Como p1 y p2 se desconoce,
Si D0 = 0, z =
pˆ 1  pˆ 2
1
1 
pˆ qˆ   
 n1 n 2 
, donde p̂ =
x1  x 2
.
n1  n2
Probabilidad y Estadística
Si D0  0, z =
Pruebas de hipótesis
110
pˆ 1  pˆ 2  D0
pˆ 1 qˆ1 pˆ 2 qˆ 2

n1
n2
4. Región de rechazo.
Prueba de una extremidad (o cola):z > z (z < z)
z es tal que P(z > z) = P(z < z) = .
Prueba de dos extremidades (o cola): z > z/2 o z < z/.
z/2 es tal que P(z > z/2) = P(z < z/2) = /2.
Suposición: Los dos muestreos son aleatorios e independientes, satisfacen las características de experimentos
binomiales y los tamaños de las muestras son n1  30 y n2  30.
___________________________________________________________________________
VALORES p
En lo que sigue p no se refiere al parámetro de una población binomial.
La probabilidad de un error tipo I, , suele denominarse nivel de significación asociada a una prueba
estadística.
El valor p, es el mínimo nivel de significación para el cual los datos observados indican que se tendría que
rechazar la hipótesis.
El mínimo nivel de significación p se determina en función de la mínima región de rechazo que se
puede considerar teniendo en cuenta que se ha observado un determinado valor para la estadística de prueba.
La idea es que un valor observado de la estadística de prueba distinto al que afirma H 0, apoya el rechazo de
H0. Por lo tanto, la región de rechazo debería contener mínimamente este valor observado de la estadística de
prueba.
Ejemplo. La producción diaria de una planta industrial química registrada durante n = 50 días tiene una
media x = 871 toneladas y una desviación estándar s = 21 toneladas.
Hipótesis nula. H0:  = 880.
Hipótesis alternativa. Prueba de dos extremidades (o cola) Ha:  880.
Estadística de prueba. z =
x  0
/ n
=
x  880
 / 50

x  880
s / 50
=
x  880
21 / 50
Se tiene el valor x = 871, entonces z = 3.03 es un valor observado de z.
Región de rechazo. Prueba de dos extremidades (o cola): z > z/2 o z < z/.
(Antes se usó  = 0.05, entonces z/ = 1.96. Luego Región de rechazo. z > 1.96 o z < 1.96)
Veamos como se determina el valor p de esta prueba.
z = 3.03 es un valor observado de z. La región de rechazo de H0, a favor de Ha, debería incluir
mínimamente este valor, por lo tanto la mínima región de rechazo posible sería
z > 3.03 o z < 3.03
p es la probabilidad de cometer un error tipo I con esta región de rechazo
p = P(z  3.03) + P(z  3.03) = 0.0024.
Por lo tanto, al utilizar esta prueba estadística se elegirán valores de   0.0024.