Download PruHipo2Pobla

Document related concepts

Prueba t de Student wikipedia , lookup

Prueba de Bartlett wikipedia , lookup

Prueba de Levene wikipedia , lookup

Análisis de la varianza wikipedia , lookup

Prueba Q de Cochran wikipedia , lookup

Transcript
PRUEBAS DE HIPÓTESIS SOBRE LA IGUALDAD DE DOS MEDIAS.
A) Varianzas conocidas
Supóngase que hay dos poblaciones de interés X1 y X2, Suponemos que X1 tiene
2
media desconocida 1 y varianza conocida  1 y que X2 tiene media desconocida
 2 y varianza conocida  2 . Estaremos interesados en la prueba de la hipótesis de
que las medias 1 y  2 sean iguales.
2
Considérense primero las hipótesis alternativas de dos lados:
H 0 : 1   2
H1 : 1   2
Donde
H0 = Hipótesis nula
H1 = Hipótesis alternativa.
1 = media de la población 1
 2 = media de la población 2
El procedimiento para probar H 0 : 1   2 es calcular la estadística de prueba Z0
mediante la siguiente fórmula:
Z0 
X1  X 2
 21
n1

 22
n2
Donde:
X 1 = media de la muestra 1
X 2 = media de la muestra 2
 2 1 = varianza de la población 1
1
 2 2 = varianza de la población 2
n1 = tamaño de la muestra 1
n 2 = tamaño de la muestra 2
La hipótesis nula H0 se rechaza si:
Z 0  Z 2 o Z 0  Z 2
Donde
Z0 = Valor calculado del estadístico de prueba
Z  2 = Valor obtenido de las tablas.
Las hipótesis alternativas de un lado se analizan de manera similar. Para probar
H 0 : 1   2
H1 : 1   2
Se calcula la estadística de prueba Z0 , y se rechaza H 0 : 1   2 si Z 0  Z .
Para probar las otras hipótesis alternativas de un lado
H 0 : 1   2
H1 : 1   2
Se utiliza la estadística de prueba Z0 y se rechaza H 0 : 1   2 si Z 0  Z
2
Ejemplo 6:
Se emplean dos máquinas para llenar botellas de plástico con un volumen neto de
16 onzas. El proceso de llenado puede suponerse normal, con desviaciones
estándar de  1  .015 y  2  .018 . Ingeniería de calidad sospecha que ambas
máquinas llenan hasta el mismo volumen neto, sin importar que este volumen sea
o no de 16 onzas. Se toma una muestra aleatoria de la salida de cada máquina.
¿Piensa usted que ingeniería de calidad está en lo correcto? Utilizando   .05 .
máquina 1
16.03
16.04
16.05
16.05
16.02
16.01
15.96
15.98
16.02
15.99
máquina 2
16.02
15.97
15.96
16.01
15.99
16.03
16.04
16.02
16.01
16
H 0 : 1   2
H1 : 1   2
Calculando las medias de cada máquina obtenemos X 1  16.015, X 2  16.005 .
Z0 
X1  X 2

2
n1
1


2
=
2
n2
16.015  16.005
.015 2 .018 2

10
10
 1.34
Z  2 = Z.025 = 1.96
3
El uso de la tabla es el siguiente:
1-.025 =.975 buscando el valor de Z correspondiente a .975 encontramos Z =
1.96
Utilizando el criterio de decisión Z 0  Z  2 para rechazar la hipótesis nula H0, nos
damos cuenta de que 1.34 no es mayor que 1.96. por lo cual no rechazamos H 0.
No existe suficiente evidencia estadística para pensar que las medias son
diferentes.
Cuando rechazamos la hipótesis nula se considera que la prueba es potente, si
aceptáramos la hipótesis nula el criterio de decisión es débil, ya que generalmente
se busca rechazar H0.
PROCEDIMIENTO EN EXCEL
Seleccionar análisis de datos en el menú herramientas. En funciones para
análisis elija la opción : Prueba z para medias de dos muestras.
4
PRUEBAS PARA LA IGUALDAD DE DOS VARIANZAS.
Presentaremos ahora pruebas para comparar dos varianzas. Supóngase que son
dos las poblaciones de interés, por ejemplo X1 y X2, donde 1, 12 ,  2 ,  22 , se
desconocen. Deseamos probar hipótesis relativas a la igualdad de las dos
varianzas, H 0 :  12   22 . Considérese que se disponen dos muestras aleatorias de
tamaño n1 de la población 1 y de tamaño n2 de la población 2, y sean S12 yS 22 las
varianzas de muestra. Para probar la alternativa de dos lados
H 0 :  12   22
H 1 :  12   22
Utilizamos el hecho de que la estadística
F0 
S12
S 22
Se distribuye como F, con n1-1 y n2 –1 grados de libertad.
Rechazaríamos H0 si
F0  F 2, n1 1, n2 1
o si
F0  F1 2,n1 1,n2 1
Donde F 2,n1 1,n2 1 y F1 2,n1 1,n2 1 son los puntos porcentuales  2 superior e inferior
de la distribución F con n1-1 y n2-2 grados de libertad. La tabla F proporciona sólo
los puntos de la cola superior de F, por lo que para determinar F1 2,n1 1,n2 1
debemos emplear
F1 2,n1 1,n2 1 =
1
F 2,n1 1,n2 1
La misma estadística de prueba puede utilizarse para probar hipótesis alternativas
de un lado. La hipótesis alternativa de un lado es:
5
H 0 :  12   22
H 1 :  12   22
Si
F0  F ,n1 1,n2 1 , rechazaríamos H 0 :  12   22 .
Ejemplo 7: Los siguientes son tiempos de quemado (en minutos) de señales
luminosas de dos tipos diferentes.
Tipo 1
63
81
57
66
82
82
68
59
75
73
Tipo 2
64
72
83
59
65
56
63
74
82
82
Pruebe la hipótesis de que las dos varianzas sean iguales. Use   .05
H 0 :  12   22
H 1 :  12   22
X 1  70.6
X 2  70
S12  88.71
S 22  100.44
F0 
S12 88.71
 .877
=
S 22 100.44
6
F 2,n1 1,n2 1 = F.025,9,9= 4.03
F1 2,n1 1,n2 1 =.248
.877 no es mayor que 4.03, por lo cual no se rechaza la hipótesis nula
H 0 :  12   22 .
PROCEDIMIENTO EN EXCEL: Seleccionar análisis de datos en el menú
herramientas. En funciones para análisis elija la opción : Prueba F para
varianzas de dos muestras.
7
Prueba F para varianzas de dos muestras
Media
Varianza
Observaciones
Grados de libertad
F
P(F<=f) una cola
Valor crítico para F (una cola)
Variable 1
70.6
88.7111111
10
9
0.88318584
0.42811371
0.2483862
Variable 2
70
100.444444
10
9
De la tabla deducimos que .248 es menor que .883 por lo cual no rechazamos H 0.
Prueba z para medias de dos muestras
Media
Varianza (conocida)
Observaciones
Diferencia hipotética de las medias
z
P(Z<=z) una cola
Valor crítico de z (una cola)
Valor crítico de z (dos colas)
Valor crítico de z (dos colas)
Variable 1
16.015
0.000225
10
0
1.34962722
0.08856785
1.644853
0.17713571
1.95996108
Variable 2
16.005
0.000324
10
En la tabla de Excel tenemos el valor z = 1.34 y el valor crítico de z (dos colas) =
1.96, como 1.34 no es mayor que 1.96 no rechazamos la hipótesis nula.
B) Varianzas desconocidas:
Consideraremos ahora pruebas de hipótesis respecto a la igualdad de las medias
1 y 2 de dos distribuciones normales donde no se conocen las varianzas  12 y 22 .
Tenemos dos casos en el primero las varianzas son iguales y en el segundo las
varianzas son desiguales, a continuación analizaremos cada uno de ellos.
Caso 1 varianzas iguales
Sean X1 y X2 dos poblaciones normales independientes con medias desconocidas
1 y 2 , y varianzas conocidas pero iguales  12   22   2 . Deseamos probar:
H 0 : 1   2
H1 : 1   2
8
Sean X1, X2, S12 , S 22 , las medias y las varianzas de las muestras, respectivamente.
Puesto que tanto S12 como S 22 estiman la varianza común  2 , podemos combinarlas
para producir una sola estimación, mediante la siguiente fórmula:
n1  1S12  n2  1S 22
Sp 
n1  n2  2
Para probar H 0 : 1   2 calcúlese la estadística de prueba
X1  X 2
1
1
Sp

n1 n2
Si t 0  t 2,n1  n2 2 o si t 0  t 2,n1  n2  2 , rechazamos H 0 : 1   2
Las alternativas de un lado se tratan de modo similar. Para probar:
t0 
H 0 : 1   2
H 1 : 1   2
Calcúlese la estadística de prueba t0 y rechácese H 0 : 1   2 si:
t 0  t ,n1  n2  2
Para la otra alternativa de un lado,
H 0 : 1   2
H 1 : 1   2
Calcúlese la estadística de prueba y rechácese H 0 : 1   2 si:
t 0  t a ,n1  n2  2
Ejemplo 8: Se está investigando la resistencia de dos alambres, con la siguiente
información de muestra.
Alambre
1
2
.140
.135
.141
.138
Resistencia (ohms)
.139
.140
.140
.139
.138
-
.144
-
Suponiendo que las dos varianzas son iguales, ¿ qué conclusiones puede
extraerse respecto a la resistencia media de los alambres?
9
H 0 : 1   2
H1 : 1   2
Calculando la media y la desviación estándar de la muestra:
x1  .140
x 2  .138
S1  .0021
S 2  .0022
Sp 
t0 
n1  1S12  n2  1S 22
n1  n2  2
= .0021
X1  X 2
= 1.72
1
1
Sp

n1 n2
Buscamos en la tabla de distribución t el valor t 2,n1 n2, 2 = t.025,8 =2.306
Utilizando el criterio de rechazo t 0  t 2,n1  n2 2 , 1.72 no es mayor que 2.306, por lo
tanto no rechazamos H0.
PROCEDIMIENTO EN EXCEL
Seleccionar análisis de datos en el menú herramientas. En funciones para
análisis elija la opción : Prueba t para dos muestras suponiendo varianzas
iguales.
10
Prueba t para dos muestras suponiendo varianzas iguales
Media
Varianza
Observaciones
Varianza agrupada
Diferencia hipotética de las medias
Grados de libertad
Estadístico t
P(T<=t) una cola
Valor crítico de t (una cola)
P(T<=t) dos colas
Valor crítico de t (dos colas)
Variable 1
0.14033333
4.2667E-06
6
4.4167E-06
0
8
1.72002633
0.06187033
1.85954832
0.12374065
2.30600563
11
Variable 2
0.138
4.6667E-06
4
En la tabla de Excel encontramos los valores deseados: 1.72 no es mayor que
2.306 por lo cual no rechazamos Ho.
Caso 2 Varianzas diferentes
Cuando las varianzas  12 y 22 son diferentes utilizamos la estadística de prueba:
t0 
X1  X 2
S12 S 22

n1 n2
Para el calculo de lo grados de libertad utilizamos:
2
 S12 S 22 



n1 n2 


2
S12 n1 2  S 22 n2 2
n1  1
n2  1
El procedimiento para llevar a cabo la prueba de hipótesis es el mismo que el caso
1, varianzas iguales excepto que se emplean t0 como estadística de prueba y n1 +
n2 -2 se sustituye por  en la determinación de los grados de libertad para la
prueba.
Ejemplo 9: Se están investigando dos métodos para producir gasolina a partir de
petróleo crudo. Se supone que el rendimiento de ambos procesos se distribuye
normalmente. Los siguientes datos de rendimiento se han obtenido de la planta
piloto.
Proceso
1
2
24.2
21.0
26.6
22.1
Rendimiento %
25.7
24.8
21.8
20.9
25.9
22.4
26.5
22.0
¿Hay alguna razón para creer que el proceso 1 tiene un rendimiento medio
mayor?
12
H 0 : 1   2
H 1 : 1   2
Calculamos la media y la varianza para ambos procesos:
x1  25.62
x 2  21.70
S12  .9017
S 22  .3760
t0 
X1  X 2
2
1
2
2
S
S

n1 n2
=
25.62  21.70
 8.48
.9017 .376

6
6
2
2
 S12 S 22 
.
9017
.
376








n1 n2 
6
6 


 2  9.32  9

2 =
.9017 62  .376 62
S12 n1 2  S 22 n2 2
7
7
n1  1
n2  1
Buscando el valor en la tabla t encontramos t.05,9 = 1,833, mediante el criterio de
rechazo para una cola t0>t.05,9 , 8.48>1.833, por lo tanto rechazamos la hipótesis
nula, y aceptamos la hipótesis alterna, el proceso 1 tiene mayor rendimiento que
el proceso 2.
PROCEDIMIENTO EN EXCEL
Seleccionar análisis de datos en el menú herramientas. En funciones para
análisis elija la opción : Prueba t para dos muestras suponiendo varianzas
desiguales.
13
Prueba t para dos muestras suponiendo varianzas desiguales
Media
Varianza
Observaciones
Diferencia hipotética de las medias
Grados de libertad
Estadístico t
P(T<=t) una cola
Valor crítico de t (una cola)
P(T<=t) dos colas
Valor crítico de t (dos colas)
Variable 1
Variable 2
25.61666667
21.7
0.901666667
0.376
6
6
0
9
8.487571675
6.87798E-06
1.833113856
1.3756E-05
2.262158887
8.48 mayor que 1.83 (valor crítico de t de una cola), se rechaza Ho.
14
PRUEBAS DE HIPÓTESIS SOBRE DOS PROPORCIONES
En las pruebas de hipótesis sobre proporciones tratamos de probar:
H 0 : p1  p 2
H 1 : p1  p 2
Considérese que se toman dos muestras aleatorias de tamaño n 1 y n2 de dos
poblaciones, y sea X1 y X2 el número de observaciones que pertenecen a la clase
de interés en la muestra 1 y 2 respectivamente.
Una estimación del parámetro común p es:
pˆ 
X1  X 2
n1  n2
La estadística de prueba para H 0 : p1  p2 es entonces:
Z0 
pˆ 1 
X1
n1
pˆ 1  pˆ 2
1
1
pˆ (1  pˆ )   
 n1 n2 
pˆ 2 
X2
n2
Si
Z 0  Z  2 o Z 0   Z  2 , la hipótesis nula se rechaza.
Ejemplo 5: La fracción de productos defectuosos producidos por dos líneas de
producción se está analizando. Una muestra aleatoria de 1000 unidades de la
línea 1 tiene 10 defectuosas , en tanto que una muestra aleatoria de 1200
unidades de la línea 2 tiene 25 defectuosas. ¿ Es razonable concluir que la línea
de producción 2 produce una fracción más alta de producto defectuoso que la
línea 1? Use   .01.
15
H 0 : p1  p2
H 1 : p1  p2
pˆ 
X1  X 2
10  25
 .015909
=
n1  n2 1000  1200
pˆ 1 
X1
n1
=
10
 .01
1000
pˆ 2 
Z0 
X2
n2
=
25
 .020833
1200
pˆ 1  pˆ 2
1
1
pˆ (1  pˆ )   
 n1 n2 
=
.01  .020833
1 
 1
. .015909(.98409) 


1000 1200 
=
-2.02
Z  Z .01  2.35
Se utiliza la estadística de prueba Z0 y se rechaza H 0 : p1  p 2 si Z 0  Z
-2.02 no es menor que –2.35 por lo cual H0 no se rechaza.
PRUEBA T POR PARES
Cuando es posible resulta ventajoso utilizar muestras pareadas en las pruebas de
comparación. En una prueba de comparación pareada, la reducción en la
variabilidad experimental puede permitir la detección de pequeños movimientos en
los datos.
A pesar de que los grados de libertad sean reducidos, porque ahora el tamaño de
muestra corresponde al número de comparaciones.
Un ejemplo de este tipo de prueba es la evaluación de dos piezas de equipo de
inspección para determinar si existe alguna diferencia significativa entre los
equipos.
Las hipótesis de prueba en torno a la igualdad 1 y 2 pueden realizarse efectuando
una prueba t de una muestra en  D . Específicamente, probar H 0 : 1   2 contra
H1 : 1   2 es equivalente a probar
H0 : D  0
H1 :  D   0
16
La estadística de prueba apropiada es
t0 
donde
D
D
SD
n
D
j
n
y
SD 
D
 D
2
j
n 1
Rechazaríamos H 0 :  D  0 si t 0  t 2,n 1 o si t 0  t 2,n 1 , las alternativas de un lado se
tratarían de manera similar.
Ejemplo 6:
Un fabricante desea comparar el proceso de armado común para uno de sus productos con
un método propuesto que supuestamente reduce el tiempo de armado. Se seleccionaron
ocho trabajadores de la planta de armado y se les pidió que armaran las unidades con ambos
procesos. Los siguientes son los tiempos observados en minutos.
Trabajador
1
2
3
4
5
6
7
8
Proceso actual Proceso propuesto
38
30
32
32
41
34
35
37
42
35
32
26
45
38
37
32
En   .05 , ¿existe alguna razón para creer que el tiempo de armado para el proceso actual
es mayor que el del método propuesto por más de dos minutos?
H0 : D  2
H1 :  D  2
Trabajador
1
2
3
4
5
6
7
8
Proceso actual Proceso propuesto
38
30
32
32
41
34
35
37
42
35
32
26
17
45
38
37
32
Dj
8
0
7
-2
7
6
7
5
4.75
(Dj-D)^2
10.5625
22.5625
5.0625
45.5625
5.0625
1.5625
5.0625
0.0625
95.5
D
D
= 4.75
n
SD 
t0 
j
D
 D
2
j
n 1
D
SD
n
=
= 3.69
4.75  2
= 2.107
3.69 8
t ,n 1  t.05, 7  1.895 , debido a que 2.107 > 1.895 rechazamos H0, y aceptamos la H1: el
tiempo de armado para el proceso actual es mayor en dos minutos que el método propuesto.
PROCEDIMIENTO EN EXCEL
Seleccionar análisis de datos en el menú herramientas. En funciones para análisis elija
la opción : Prueba t para medias de dos muestras emparejadas.
18
Prueba t para medias de dos muestras emparejadas
Media
Varianza
Observaciones
Coeficiente de correlación de Pearson
Diferencia hipotética de las medias
Grados de libertad
Estadístico t
P(T<=t) una cola
Valor crítico de t (una cola)
P(T<=t) dos colas
Valor crítico de t (dos colas)
Variable 1
37.75
22.2142857
8
0.64648725
2
7
2.10583831
0.03661855
1.89457751
0.0732371
2.36462256
Variable 2
33
15.1428571
8
De la tabla concluimos que 2.105 > 1.895 (valor crítico de t una cola), por lo cual
rechazamos Ho.
19