Download Prueba de una hipótesis estadistica

Document related concepts
no text concepts found
Transcript
Prueba de Hipótesis
En otras unidades se muestra como puede estimarse un parámetro a partir de los
datos contenidos en una muestra. Puede encontrarse ya sea en un solo número o en un
intervalos de valores posibles. Sin embargo, muchos problemas requieren que se tomen
una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta
proposición recibe el nombre de hipótesis y el procedimiento de toma de decisiones sobre
la hipótesis se conoce como prueba de hipótesis. Es conveniente considerar a la prueba
de hipótesis estadística como la etapa de análisis de datos de un experimento
comparativo, en el que se está interesado por ejemplo en comparar la media de una
población con un valor especificado. Estos sencillos experimentos comparativos se
encuentran muy a menudo en la práctica y proporcionan una buena fundamentación para
problemas de diseño experimental más complejos, En esta unidad se estudian
experimentos comparativos donde intervienen una o dos poblaciones, y la finalidad es
probar hipótesis con respecto a los parámetros de las poblaciones.
Ahora es momento de dar una definición formal de una hipótesis estadística.
Definición:
Una hipótesis estadística es una proposición sobre los parámetros de una o más
poblaciones.
Puesto que se emplean distribuciones de probabilidad para representar
poblaciones, también es posible considerar una hipótesis estadística como una
proposición sobre la distribución de probabilidad de una variable aleatoria. Lo usual es
que la hipótesis involucre a uno o más parámetros de esta distribución.
Por ejemplo, supóngase que se tiene interés en la rapidez de combustión de un
agente propulsor sólido utilizado en los sistemas de salida de emergencia para la
tripulación de aeronaves. La rapidez de combustión es una variable aleatoria que puede
describirse con una distribución de probabilidad. Supóngase que el interés se centra
sobre la rapidez de combustión promedio (que es un parámetro de esta distribución). De
manera específica, el interés recae en decidir si la rapidez de combustión promedio es o
no 50 cm/s. Esto puede expresarse de manera formal como:
1
Prueba de Hipótesis
H0: μ = 50 cm/s
H1: μ ≠ 50cm/s
La proposición H0: μ = 50 cm/s de la ecuación se conoce como hipótesis nula, mientras
que la proposición H1: μ ≠ 50cm/s recibe el nombre de hipótesis alternativa.
Puesto que la hipótesis alternativa especifica valores de μ que pueden ser mayores o
menores que 50 crn/s, también se conoce como hipótesis alternativa bilateral. En algunas
situaciones, lo que se desea es formular una hipótesis alternativa unilateral, como en
H0: μ = 50 cm/s
H0: μ = 50 cm/s
o
H1: μ < 50cm/s
H1: μ > 50cm/s
Es importante recordar que las hipótesis siempre son proposiciones sobre la
población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo general, el
valor del parámetro de la población especificado en la hipótesis nula (50 cm/s en el
ejemplo anterior) se determina en una de tres maneras diferentes. Primero, puede ser
resultado de la experiencia pasada o del conocimiento del proceso, o incluso de pruebas
o experimentos previos. Entonces, el objetivo de la prueba de hipótesis usualmente es
determinar si ha cambiado el valor del parámetro. Segundo, este valor puede obtenerse a
partir de alguna teoría o modelo que se relaciona con el proceso bajo estudio. En este
caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo. Aparece una
tercera situación cuando el valor del parámetro de la población proviene de
consideraciones externas, tales como las especificaciones de diseño o ingeniería, o de
obligaciones contractuales. En esta situación, el objetivo usual de la prueba de hipótesis
es probar el cumplimiento de las especificaciones.
Un procedimiento que conduce a una decisión sobre una hipótesis en particular
recibe el nombre de prueba de hipótesis. Los procedimientos de prueba de hipótesis
dependen del empleo de la información contenida en una muestra aleatoria de la
población de interés. Si esta información es consistente con la hipótesis, se concluye que
ésta es verdadera; sin embargo, si esta información es inconsistente con la hipótesis, se
concluye que ésta es falsa. Debe hacerse hincapié en que la verdad o falsedad de una
2
Prueba de Hipótesis
hipótesis en particular nunca puede conocerse con certidumbre, a menos que pueda
examinarse a toda la población. Usualmente esto es imposible en muchas situaciones
prácticas. Por tanto, es necesario desarrollar un procedimiento de prueba de hipótesis
teniendo en cuenta la probabilidad de llegar a una conclusión equivocada.
La estructura de los problemas de prueba de hipótesis es idéntica en todas las
aplicaciones que se considerarán en esta unidad. La hipótesis nula es la hipótesis que
desea probarse. El rechazo de la hipótesis nula siempre conduce a la aceptación de la
hipótesis alternativa. En el estudio de la prueba de hipótesis, la hipótesis nula siempre de
plantea de modo que especifique un valor exacto del parámetro (como en la proposición
Ho: μ = 50 cm/s). La hipótesis alternativa permite que el parámetro tome varios valores
(como en la proposición H1: μ ≠ 50cm/s). La prueba de hipótesis involucra la toma de una
muestra aleatoria, el cálculo de un estadístico de prueba a partir de los datos muestrales,
y luego el uso de este estadístico para tomar una decisión sobre la hipótesis nula.
Prueba de una hipótesis estadistica
Para ilustrar los conceptos generales, considérese el problema de la rapidez de
combustión del agente propulsor presentado con anterioridad. La hipótesis nula es que la
rapidez promedio de combustión es 50 cm/s, mientras que la hipótesis alternativa es que
ésta no es igual a 50 cm/s. Esto es, se desea probar:
H0: μ = 50 cm/s
H1: μ ≠ 50cm/s
Supóngase que se realiza una prueba sobre una muestra de n = 10 especímenes,
y que se observa cuál es la rapidez de combustión promedio x. La media muestral es un
estimador de la media verdadera de la población μ. Un valor de la media muestral x que
esté próximo al valor hipotético
H0: μ = 50 cm/s es una evidencia de que el verdadero
valor de la media μ es realmente 50 cm/s; esto es, tal evidencia apoya la hipótesis nula
Ho. Por otra parte, una media muestral muy diferente de 50 cm/s constituye una evidencia
que apoya la hipótesis alternativa H1.
Por tanto, en este caso, la media muestral es el estadístico de prueba.
3
Prueba de Hipótesis
La media muestral puede tomar muchos valores diferentes. Supóngase que si
48.5≤x≤51.5, entonces se acepta la hipótesis nula H0: μ = 50, y que si x < 48.5 o x > 51.5,
entonces se acepta la hipótesis alternativa H1: μ ≠ 50cm/s. Esto se ilustra en la figura
siguiente.
Se acepta H1
Se acepta H0
Se acepta H1
μ ≠ 50cm/s
μ = 50 cm/s
μ ≠ 50cm/s
|
48.5
50
|
_
51.5
X
Los valores de x que son menores que 48.5 o mayores que 51.5 constituyen la región
crítica de la prueba, mientras que todos los valores que están en el intervalo 48.5 ≤x≤ 51.5
forman la región de aceptación. Las fronteras entre las regiones crítica y de aceptación
reciben el nombre de valores críticos. En el ejemplo, los valores críticos son 48.5 y 51.5.
Por otra parte, la costumbre es establecer conclusiones con respecto a la hipótesis nula
H0. Por tanto, se rechaza H0 en favor de Hl si el estadístico de prueba cae en la región
crítica, de lo contrarío, se acepta H0.
Este procedimiento de decisión puede conducir a una de dos conclusiones
erróneas. Por ejemplo, es posible que el verdadero valor de la rapidez promedio de
combustión del agente propulsor sea igual con 50 cm/s. Sin embargo, para todos los
especímenes bajo prueba, bien puede observarse un valor del estadístico de prueba x
que cae en la región crítica. En este caso, la hipótesis nula H0 será rechazada en favor de
la alternativa H1, cuando, de hecho, H0 en realidad es verdadera. Este tipo de conclusión
equivocada se conoce como error tipo I.
El error tipo I se define como el rechazo de la hipótesis nula H0 cuando esta es
verdadera.
Ahora supóngase que la verdadera rapidez promedio de combustión es diferente
de 50cm/s, aunque la media muestral x caiga dentro de la región de aceptación. En este
caso se acepta H0 cuando ésta es falsa. Este tipo de conclusión errónea recibe el nombre
de error tipo II.
El error tipo se define como la aceptación de la hipótesis nula cuando esta es falsa.
4
Prueba de Hipótesis
Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones
diferentes que determinan si la decisión final es correcta o errónea. Estas situaciones
aparecen en la tabla que a continuación se expone:
Decisión
Aceptar H0
Rechazar H0
H0 es verdadera
H0 es falsa
no hay error
error tipo II
error tipo I
no hay error
Dado que la decisión se basa en variables aleatorias, entonces es posible asociar
probabilidades con los errores tipo I y II de la tabla. La probabilidad de cometer un error
tipo I se denota con la letra griega α. Esto es,
α = P(error tipo I) = P(rechazar H0 ¦ H0 es verdadero)
Algunas veces, la probabilidad del error tipo I, recibe el nombre de nivelo tamaño de
significancia de la prueba. En el ejemplo de la rapidez promedio de combustión del agente
propulsor, se presenta un error tipo I cuando x > 51.5 o x < 48.5 y la verdadera rapidez
promedio de combustión es μ =50 cm/s. Supóngase que la desviación estándar de la
rapidez de combustión es σ√n = 2.5 cm/s y que la rapidez de combustión tiene una
distribución para la que se aplican las condiciones del teorema del limite central, de modo
que la distribución de la media muestral es aproximadamente normal con media μ=50 y
desviación estándar σ√n = √2.5/10 = 0.79. La probabilidad de cometer un error tipo I es
igual la suma de las áreas que aparecen sombreadas las colas de la distribución normal
de la siguiente figura. Esta probabilidad puede calcularse de la siguiente manera:
_
_
α =P(X < 48.5 | μ = 50) +P(X > 51.5 | μ =50)
Los valores de z que corresponden a los valores típicos 48.5 y 51.5 son
Z1 = 48.5 - 50
= -1.90
0.79
Z2 = 51.5 - 50
= 1.90
5
Prueba de Hipótesis
0.79
Por consiguiente,
α = P(Z< -1.90) + P(Z> 1.90)
= 0.0288 + 0.0288
= 0.0576
Esto implica que el 5.76% de todas las, muestras aleatorias conducirán al rechazo de
hipótesis H0 : μ= 50 cm/s cuando la verdadera rapidez promedio de combustión es en
realidad 50 cm/s.
Al analizar la figura precedente se nota que es posible reducir a al aumentar la región de
aceptación. Por ejemplo, si se toman como valores críticos 48 y 52, el valor de α es
α = P (z < 48 -50 )+ P(z > 52 -50 )
0.79
0.79
= P(Z < -2.53) + P(Z > 2.53)
= 0.0057 + 0.0057
= 0.0114
También puede reducirse el valor de a mediante el incremento del tamaño de la
muestra. Si n = 16, entonces σ / √n = 2.5/ √16 = 0.625 y, al utilizar la región crítica original
de la figura, se tiene que:
z1= 48.5 -50 = -2.40
6
Prueba de Hipótesis
0.625
y
z2= 51.5 –50 = 2.40
0.625
Por consiguiente,
α = P(Z < -2.40) + P(Z > 2.40) = 0.0082 + 0.0082 = 0.0164
Al evaluar un procedimiento de prueba de hipótesis, también es importante
examinar la probabilidad del error tipo II, el cual se denota por β. Esto es,
β = P(error tipo II) = P(aceptar H0| H0 es falsa)
Para calcular β se debe tener una hipótesis alternativa específica; esto es, debe
tenerse un valor particular de μ. Por ejemplo, supóngase que es importante rechazar la
hipótesis nula H0:μ = 50 cada vez que la rapidez promedio de combustión μ es mayor que
52 crn/s o menor que 48 crn/s. Para elIo, puede calcularse la probabilidad β de un error
tipo II para los valores μ = 52 y μ=48, y utilizar este resultado para averiguar algo con
respecto a la forma en que se desempeñará la prueba. De manera específica, ¿cómo
trabajará el procedimiento de prueba si se desea detectar, esto es, rechazar H0, para un
valor medio de μ = 52 o μ = 48? Dada la simetría, solo es necesario evaluar uno de los
dos casos; esto es, encontrar la probabilidad de aceptar la hipótesis nula H 0:μ=50 crn/s
cuando el valor verdadero es μ = 52 crn/s.
La figura que a continuación se expone será de gran ayuda para calcular la
probabilidad β de un error tipo II. La distribución normal de la parte izquierda de la figura
es la distribución del estadístico de prueba X cuando la hipótesis nula H0:μ = 50 es
verdadera (esto es lo que se entiende con la expresión "bajo H0:μ = 50), y la distribución
normal de la derecha es la distribución de X cuando la hipótesis alternativa es verdadera y
el valor de la media es 52 (o "bajo H0:μ = 52"). Se comete un error tipo II si la media
muestral x cae entre 48.5 y 51.5 (que son las fronteras de la región crítica) cuando μ =
52. Como puede verse en la figura, esto es solo la probabilidad de que 48.5 ≤ X ≤ 51.5
cuando la media verdadera es μ = 52, lo que corresponde al área sombreada bajo la
distribución normal de la derecha. Por lo tanto, con respecto a esta figura, se tiene:
7
Prueba de Hipótesis
_
β = P (48.5 ≤ X ≤ 51.5 | μ = 52)
Los valores de z que corresponden a 48.5 y 51.5 cuando μ = 52 son:
z1= 48.5 - 52 = -4.43
0.79
y
z2= 51.5 –52 = -0.63
0.79
Entonces:
β = P (-4.43 ≤ X ≤ -0.63)
= P (z ≤ -0.63) - P (z ≤ -4.43)
= 0.2643 – 0.000
= 0.2643
8
Prueba de Hipótesis
En consecuencia, si se prueba H0 : μ= 50 contra H0 : μ= 50 con n=10 y el valor
verdadero de la media es μ = 52, la probabilidad de que se acepte la hipótesis nula falsa
es 0.2643. Por simetría, si el valor verdadero de la media es μ = 48, el valor de β también
es 0.2643.
La probabilidad β de cometer un error tipo II aumenta rápidamente a medida que el
valor verdadero de μ tiende al valor hipotético. Por ejemplo, en la figura a continuación:
donde el valor verdadero de la media es μ = 50.5 y el valor hipotético es H0: μ = 50. El
valor verdadero de μ está muy próximo a 50, y el valor de β es
β = P(48.5 ≤ X ≤ 51.51 | μ = 50.5)
Tal como se muestra en la figura precedente, los valores de z que corresponden a 48.5 y
51.5 cuando μ = 50.5 son
z1= 48.5 – 50.5 = -2.53
0.79
y
z2= 51.5 –50.5 = 1.27
0.79
9
Prueba de Hipótesis
Por consiguiente,
β = P( -2.53 ≤ Z ≤ 1.27)
= P(Z ≤ 1.27) - P(Z ≤ -2.53)
= 0.8980 -0.0057
= 0.8923
Por tanto, la probabilidad del error tipo II es mucho mayor para el caso donde la
media verdadera es 50.5 cm/s, que para el caso donde ésta es 52 cm/s. Claro está que
en muchas situaciones prácticas el interés no recae en cometer un error tipo II si la media
está "próxima" al valor hipotético de ésta. Se podría estar más interesado en detectar
diferencias grandes entre la media verdadera y el valor especificado en la hipótesis nula.
La probabilidad del error tipo II también depende del tamaño de la muestra n.
Supóngase que la hipótesis nula es H0:μ = 50 cm/s y que el valor verdadero de la media
es μ = 52. Si el tamaño de la muestra aumenta de n = 10 a n = 16, entonces se obtiene la
situación ilustrada en la figura siguiente. La distribución normal de la izquierda es la
distribución de X cuando la media μ = 50, mientras que la distribución normal de la
derecha es la distribución de X cuando μ = 52. Tal como se muestra en la figura, la
probabilidad del error tipo II es:
10
Prueba de Hipótesis
β= P(48.5 ≤ X ≤ 51.5 | μ = 52)
Cuando μ = 16, la desviación estándar de X es σ/√n = 2.5/ √16 = 0.625, y los valores de z
que corresponden a 48.5 y 51.5 cuando μ = 52 son
z1= 48.5 – 52 = -5.60
0.625
y
z2= 51.5 – 52 = -0.80
0.625
Por consiguiente:
β = P(-5.60 ≤ Z ≤ -0.80)
= P(Z ≤ -0.80) – P(Z ≤ - 5.60)
= 0.2119 -0.000
= 0.2119.
11
Prueba de Hipótesis
Hay que recordar que cuando n = 10 y μ = 52, se tiene que β = 0.2643; por tanto, el
aumento en el tamaño de la muestra da como resultado una disminución en la
probabilidad del error tipo II.
A continuación se resumen los resultados de esta sección, así como otros cálculos
similares:
Región de
Tamaño de la
aceptación
muestra
48.5 < x < 51.5
10
48 < x < 52
α
Β para μ = 52
Β para μ = 50.5
0.0576
0.2643
0.8923
10
0.0114
0.5000
0.9705
48.5 < x < 51.5
16
0.0164
0.2119
0.9445
48 < x < 52
16
0.0014
0.5000
0.9918
Los resultados con negrita no fueron calculados en el texto, pero el lector puede
verificarlos con facilidad. La tabla y lo estudiado hasta el momento revelan cuatro puntos
importantes:
1) El tamaño de la región crítica y, en consecuencia, la probabilidad α de un error tipo I,
siempre pueden reducirse mediante una selección apropiada de los valores críticos.
2) Los errores tipo I y II están relacionados. Una disminución en la probabilidad en un tipo
de error siempre da como resultado un aumento en la probabilidad del otro, siempre y
cuando el tamaño de la muestra n no cambie.
3) En general, un aumento en el tamaño de la muestra reduce tanto a α como a β ,
siempre y cuando los valores críticos se mantengan constantes.
4) Cuando la hipótesis nula es falsa, β aumenta a medida que el valor verdadero del
parámetro tiende al valor hipotético propuesto por la hipótesis nula. El valor de β
disminuye a medida que aumenta la diferencia entre el verdadero valor medio y el
propuesto.
En general, el analista controla la probabilidad α del error tipo I cuando escoge los
valores críticos. Así, usualmente es más fácil para el analista fijar la probabilidad del error
tipo I en (casi) cualquier valor deseado. Puesto que el analista puede controlar de manera
12
Prueba de Hipótesis
directa la probabilidad de rechazar de manera errónea H0, siempre puede considerarse el
rechazo de la hipótesis nula H0 como una conclusión fuerte.
Por otra parte, la probabilidad β del error tipo II no es constante, sino que depende
del valor verdadero del parámetro. Ésta también depende del tamaño de la muestra que
se haya seleccionado. Dado que la probabilidad β del error tipo II es una función tanto del
tamaño de la muestra como del punto en el cual la hipótesis nula H 0 es falsa, es
costumbre considerar la decisión de aceptar H0 como una conclusión débil, a menos que
se sepa que β es aceptablemente pequeño. Por consiguiente, más que decir "se acepta
H0", se prefiere la terminología "incapaz de rechazar H0". La incapacidad de rechazar H0
implica que no se ha encontrado evidencia suficiente para rechazar a H0, esto es, para
hacer una proposición fuerte. La incapacidad de rechazar H 0 no significa necesariamente
que exista una probabilidad grande de que H0 sea cierta. Esto simplemente significa que
se requieren más datos para alcanzar una conclusión fuerte. Lo anterior puede tener
implicaciones importantes para la formulación de hipótesis.
Un concepto importante que se usará más adelante es el de la potencia de una
prueba estadística.
La potencia de una prueba estadística es la probabilidad de rechazar la hipótesis nula Ho
cuando fa hipótesis alternativa es verdadera.
El valor de la potencia es 1 - β, y la potencia puede interpretarse como la
probabilidad de rechazar de manera correcta una hipótesis nula falsa. A menudo las
pruebas estadísticas se comparan mediante la comparación de sus propiedades de
potencia. Por ejemplo, considérese el problema de la rapidez de combustión del agente
propulsor cuando se prueba H0:μ = 50 cm/s contra
H1:μ ≠ 50 cm/s. Supóngase que
el valor verdadero de la media es μ = 52. Cuando n = 10, se tiene que β = 0.2643, de
modo que la potencia de esta prueba es 1 -β = 1 - 0.2643 = 0.7357 cuando μ = 52.
La potencia es una medida muy descriptiva y concisa de la sensibilidad de una
prueba estadística, donde por sensibilidad se entiende la capacidad de una prueba para
detectar diferencias. En este caso, la sensibilidad de la prueba para detectar la diferencia
entre una rapidez promedio de combustión de 50 cm/s y otra de 52 cm/s, es 0.7357. Esto
es, si el valor verdadero de la media es en realidad
52 cm/s, esta prueba rechazará de
manera correcta H0:μ = 50 cm/s y "detectará" esta diferencia e173 .57% de las veces. Si
13
Prueba de Hipótesis
se piensa que el valor de esta potencia es bajo, entonces el analista puede aumentar a o
el tamaño de la muestra n.
Hipótesis unilaterales y bilaterales
Una prueba de cualquier hipótesis, tal como
H0:μ = 50 cm/s
H1:μ ≠ 50 cm/s
recibe el nombre de prueba bilateral, debido a que es importante detectar diferencias a
partir del valor hipotético de la media μ0 que se encuentren en cualquier lado de μ0. En
una prueba de este tipo, la región crítica se separa en dos partes, con (usualmente) la
misma probabilidad en cada cola de la distribución de la estadística de prueba.
Muchos problemas de prueba de hipótesis involucran de manera natural hipótesis
alternativas unilaterales, tales como
H0:μ = μ0
H1:μ >μ0
o
H0:μ = μ0
H1:μ < μ0
Si la hipótesis alternativa es H1:μ >μ0
la región crítica debe encontrarse en la cola
superior de la distribución del estadístico de prueba, mientras que si la hipótesis
alternativa es H1:μ < μ0
la región crítica debe encontrarse en la cola inferior de la
distribución. En consecuencia, en ocasiones estas pruebas se conocen como pruebas de
una cola. Es fácil localizar la región crítica para pruebas unilaterales.
Para
ello,
simplemente se visualiza el comportamiento del estadístico de prueba si la hipótesis nula
14
Prueba de Hipótesis
es verdadera, y se coloca la región crítica en el extremo o cola apropiada de la
distribución. En general, la desigualdad en la hipótesis alternativa "apunta" en la dirección
de la región crítica.
Al construir hipótesis, siempre se plantea la hipótesis nula como una igualdad, de
modo que la probabilidad α del error tipo I pueda controlarse en un valor específico. La
hipótesis alternativa puede ser unilateral o bilateral, dependiendo de la conclusión que ha
de obtenerse si se rechaza H0. Si el objetivo es hacer una afirmación donde aparezcan
proposiciones tales como "mayor que", "menor que", "superior a", "excede a", "al menos"
y otras similares, entonces la alternativa unilateral es la que resulta más apropiada. Si la
afirmación no implica ninguna dirección, o si es del tipo "no es igual a", entonces debe
utilizare la alternativa bilateral.
En algunos problemas reales, donde se recomiendan los procedimientos de prueba
unilaterales, en ocasiones es difícil escoger un planteamiento apropiado de la hipótesis
alternativa. Por ejemplo, supóngase que un embotellador de refresco compra botellas de
10 onzas a una compañía vidriera. El embotellador desea estar seguro de que las botellas
cumplen con las especificaciones sobre la presión interna promedio o presión de
estallamiento, la cual, para botellas de 10 onzas, debe tener un valor mínimo de 200 psi.
El embotellador ha resuelto formular el procedimiento de decisión para un lote especifico
de botellas COmo un problema de hipótesis. Para este problema, existen dos
planteamientos posibles:
Ho: μ = 200 psi
H1: μ > 200 psi
o
Ho: μ = 200 psi
H1: μ < 200 psi
Considérese el planteamiento dado por la primera ecuación. Si se rechaza la hipótesis
nula, entonces las botellas serán juzgadas como satisfactorias; mientras que si no se
rechaza H0, la implicación es que las botellas no cumplen con las especificaciones y, por
ende, no deben utilizarse. Dado que el rechazo de H0 es una conclusión fuerte, este
planteamiento obliga al fabricante de las botellas a "demostrar" que la presión de
estallamiento promedio de las botellas es mayor que la especificada. Ahora considérese
el planteamiento dado por la segunda ecuación. En esta situación, las botellas serán
15
Prueba de Hipótesis
consideradas satisfactorias a menos que se rechace H0. Esto es, se concluye que las
botellas son satisfactorias a menos que exista evidencia fuerte en sentido contrario.
¿Qué planteamiento es el correcto: el de la primera ecuación o el de la segunda
ecuación? La respuesta es "depende". Para la primera ecuación, existe cierta probabilidad
de que H0 no sea rechazada (esto es, puede decidirse que las botellas no son
satisfactorias), aun cuando la verdadera media sea ligeramente mayor que 200 psi. Este
planteamiento implica que se desea que el fabricante de las botellas demuestre que el
producto cumple o excede las especificaciones. Tal planteamiento puede ser apropiado si,
en el pasado, el fabricante ha experimentado dificultades para cumplir con las
especificaciones, o si las condiciones de seguridad del producto lo obligan a ajustarse de
manera estricta a la especificación de 200 psi. Por otra parte, para el planteamiento de la
segunda ecuación, existe cierta probabilidad de que H0 será aceptada y se considerará
que las botellas son satisfactorias, aun cuando la verdadera media sea ligeramente menor
que 200 psi. Puede concluirse que las botellas no son satisfactorias sólo cuando existe
una fuerte evidencia de que la media no es mayor que 200 psi, esto es, cuando se
rechace H0: μ = 200 psi. Este planteamiento supone que todos están felices con el
desempeño pasado del fabricante y que las pequeñas desviaciones de la especificación μ
≥ 200 psi no serán de consecuencias.
Al formular hipótesis alternativas unilaterales, debe recordarse que el rechazo de
H0 siempre es una conclusión fuerte. En consecuencia, en la hipótesis alternativa debe
ponerse la proposición sobre la que es importante llegar a una conclusión fuerte. A
menudo, en problemas reales, esto depende del punto de vista de los involucrados y de la
experiencia que tengan con la situación.
Pasos de la prueba de hipótesis
Para los distintos casos prácticos que se pueden presentar ante una investigación,
se recomienda utilizar los siguientes pasos al aplicar la metodología de prueba de
hipótesis.
1) Del contexto del problema, identificar el parámetro de interés.
2) Establecer la hipótesis nula, H0.
3) Especificar una apropiada hipótesis alternativa, H1.
4) Seleccionar un nivel de significancia α.
16
Prueba de Hipótesis
5) Establecer un estadístico de prueba apropiado.
6) Establecer la región de rechazo para el estadístico.
7) Calcular todas las cantidades muestrales necesarias, sustituirlas en la ecuación
para el estadístico de prueba y calcular el valor correspondiente.
8) Decidir si debe o no rechazarse H0 y notificar esto en el contexto del problema.
Los pasos 1 a 4 deben completarse antes de examinar los datos muestrales.
Algunos comentarios prácticos sobre la prueba de hipótesis
En la práctica, este procedimiento formal y (en apariencia) rígido, no siempre es
necesario. En general, una vez que el experimentador (o tomador de decisiones) ha
decidido sobre la pregunta de interés y ha determinado el diseño del experimento (esto
es, cómo recopilar los datos, cómo tomar las mediciones y cuántas observaciones se
requieren), entonces en realidad sólo se necesitan tres pasos:
1. Especificar la estadística de prueba que va a utilizarse (tal como z0).
2. Especificar la ubicación de la región crítica (de dos colas, de cola superior o de cola
inferior).
3. Especificar los criterios de rechazo (en general, el valor de α, o el valor P para el que
debe ocurrir el rechazo).
A menudo, en la solución de problemas reales, estos pasos se completan casi al mismo
tiempo, aunque es necesario hacer hincapié en que es necesario reflexionar
detenidamente cada uno de ellos. Esta es la razón por la que se presentó y se utilizó el
proceso de ocho pasos: parece reforzar los fundamentos del enfoque correcto. Si bien, tal
vez no se utilice todas las veces en la solución de problemas reales, es un marco de
referencia útil cuando se aprenden por primera vez métodos estadísticos.
Significado estadístico y significado práctico: Ya se ha mencionado que es muy útil
notificar los resultados de una prueba de hipótesis en términos de un valor P, ya que esto
conlleva más información que la simple proposición "rechazar H 0" o "no es posible
rechazar H0". Esto es, el rechazo de H0 con un nivel de significancia 0.05 tiene un
significado mayor si el valor del estadístico de prueba está bien ubicado en la región
crítica, excediendo por más del 5% el valor crítico, que si apenas excede este valor.
17
Prueba de Hipótesis
Incluso un valor P muy pequeño puede ser difícil de interpretar desde un punto de vista
práctico cuando se toman decisiones, ya que, si bien un valor pequeño de P indica
significancia estadística en el sentido en que debe rechazarse H 0 en favor de H1 el
alejamiento real detectado con respecto a H0 puede tener poca significancia práctica (a
los ingenieros les gusta decir "significancia ingenieril"). Esto es particularmente cierto
cuando el tamaño de la muestra n es grande.
Construcción de la prueba: cuando se muestrea una población normal con media μ y
varianza conocida σ2 y se prueba H0: μ =μ0 contra H1: μ >μ0, se comienza con la media
muestral X y luego se emplea la estadística de prueba estandarizada
Z0 = x - μ0
σ / √n
Entonces, la intuición sugiere que se rechace H0: μ =μ0 cuando el valor numérico de Z0 es
grande. La región crítica se obtiene al usar el hecho de que Z 0 tiene una distribución
normal estándar cuando H0:μ =μ0 es verdadera, de modo que el punto Zα será el valor
crítico apropiado.
Pueden emplearse métodos más formales para el desarrollo de procedimientos
para la prueba estadística de hipótesis. Un método muy utilizado para la construcción de
pruebas es el principio de la razón de verosimilitudes. Muchos de los procedimientos
de prueba presentados en este libro pueden obtenerse con el empleo de este método. Por
ejemplo, la prueba anterior es una prueba de razón de verosimilitudes. A menudo, las
pruebas estadísticas obtenidas a partir de este principio tienen el error tipo II más
pequeño (la β más pequeña) de entre todas las pruebas que tienen la misma probabilidad
para el error tipo I (α). Es así como, en cierto sentido, éstos son procedimientos de prueba
óptimos.
Prueba de hipótesis sobre la media
En esta parte de la unidad se consideran pruebas de hipótesis sobre la media de
una población (o la media de una distribución de probabilidad), donde la varianza de la
población es conocida.
18
Prueba de Hipótesis
Las suposiciones para esta prueba son mínimas. La población o distribución de
interés tiene media μ y varianza σ2, con σ2 conocida. El estadístico de prueba se basa en
la media muestral X, por lo que también se supondrá que la población está distribuida de
manera normal o que se aplican las condiciones del teorema del límite central. Esto
significa que la distribución de X es aproximadamente normal con media μ y varianza
σ2/n.
Desarrollo del procedimiento de prueba: Supóngase que se desea probar la hipótesis
H0:μ =μ0
H1:μ ≠ μ0
donde μ0 es una constante específica. Se tiene una muestra aleatoria X1,X2,....Xn de la
población. Puesto que X tiene una distribución aproximadamente normal con media μ0 y
desviación estándar σ2/√n si la hipótesis nula es verdadera, entonces puede construirse
una región crítica con base en el valor calculado de la media muestral x.
Habitualmente, es más conveniente estandarizar la media muestral y utilizar la
estadística de prueba basada en la distribución normal estándar. Esto es, el
procedimiento de prueba para H0:μ =μ0 utiliza el estadístico de prueba
Z0 = x - μ0
σ2/√n
si la hipótesis nula H0:μ =μ0 es verdadera, E( X) =μ0, de donde se desprende que la
distribución de Z0 es la distribución normal estándar [denotada por N(0,1)]. En
consecuencia, si H0:μ =μ0 es cierta, la probabilidad de que la estadística de prueba Z0
caiga entre -Zα/2 y Zα/2 es 1-α. (Recuérdese que Zα/2 es el punto que corresponde al
porcentaje 100 α/2 de la distribución normal estándar.) La figura que a continuación se
presenta ilustra esta situación.
19
Prueba de Hipótesis
Nótese que la probabilidad de que la estadística de prueba Z0 caiga en la región Z0 > Zα/2
o Z0 < - Zα/2 cuando H0:μ =μ0 es verdadera, es α. Es evidente que una muestra que
produce un valor del estadístico de prueba que cae en las colas de la distribución de Z0
será inusual si H0:μ =μ0 es cierta, por tanto, esto es un indicador de que H0 es falso. En
consecuencia, H0 debe rechazarse si
Z0 > Zα/2
o
Z0 < - Zα/2
Por otra parte, H0 no puede rechazarse si
- Zα/2 ≤ Z0 ≤ Zα/2
La última ecuación expuesta define la región de aceptación de H 0, y las ecuaciones
anteriores definen la región crítica o región de rechazo. La probabilidad del error tipo I
para este procedimiento de prueba es α.
En general, es más fácil comprender la región crítica y el procedimiento de prueba
usando la estadística de prueba es Z0 más que X. Sin embargo, la misma región critica
siempre puede escribirse en términos del valor calculado de la media muestral x. Un
procedimiento idéntico al anterior es el siguiente:
_
_
Rechazar H0 : µ = µ0 si X > a o X < b
Donde
20
Prueba de Hipótesis
a = µ0 + Zα/2 σ2/√n
b = µ0 - Zα/2 σ2/√n
También pueden desarrollarse procedimientos para la prueba de hipótesis sobre µ,
donde la hipótesis alternativa es unilateral. Supóngase que se especifican las hipótesis
como:
H0:μ =μ0
H1:μ >μ0
Al definir la región crítica para esta prueba, se observa que un valor negativo de la
estadística de prueba Z0 nunca conducirá a la conclusión de que H0 : µ = µ0 es falsa. Por
consiguiente, la región crítica debe colocarse en la cola superior de la distribución normal
estándar y el rechazo de H0 se hará cuando el valor calculado de Z0 sea muy grande. Esto
es, H0 será rechazada si
Z0 >Zα
De manera similar, para probar
H0 : µ = µ0
H1 : µ < µ0
Se calcula la estadística de prueba Z0 y se rechaza H0, sí el valor de Z0 es muy pequeño
Esto la región crítica se encuentra en la cola inferior de la distribución normal estándar y
se rechaza H0 ,si
Z0 > - Zα
Valores P en la prueba de hipótesis
Una manera de notificar los resultados de una prueba de hipótesis es establecer
que la hipótesis nula fue o no rechazada con un valor especificado de α o nivel de
significancia. A menudo, este planteamiento de conclusiones resulta inadecuado, ya que
21
Prueba de Hipótesis
no brinda al tomador de decisiones ninguna , si el valor calculado de la estadística de
prueba estaba apenas en la región de rechazo o bien ubicado dentro de ella. Además,
establecer de esta manera los resultados, impone a otros usuarios de la información el
nivel de significancia predeterminado. Este puede ser poco satisfactorio, ya que algunos
tomadores de decisiones se sentirán incómodos con los riesgos implicados por α = 0.05.
Para evitar estas dificultades, en la práctica se ha adoptado, de manera amplia, el
enfoque del valor P. El valor p es la probabilidad de que el estadístico de prueba tome un
valor menos tan extremo como el valor observado del estadístico de prueba cuando ola
hipótesis nula H0, es verdadera. Es así como el valor P acarrea mucha información sobre
el evidencia contra H0 de modo que el tomador de decisiones pueda llegar a una
conclusión para cualquier nivel de significancia especificado. A continuación se
proporciona definición formal de un valor P
El valor P es el nivel de significancia más pequeño que conduce al rechazo de la hipótesis
nula H0.
Es habitual llamar al estadístico de prueba (ya los datos) significante cuando se
rechaza a la hipótesis nula H0; por tanto, el valor P puede considerarse como el nivel de
significancia α más pequeño para el que los datos son significativos. Una vez que se
conoce el valor P, el tomador de decisiones puede determinar por si mismo cuán
significativos son los datos, sin que el analista de los mismos imponga un nivel de
significancia seleccionado de antemano.
Para las pruebas de distribuciones normales presentadas hasta el momento, es
relativamente sencillo calcular el valor P. Si Z0 es el valor calculado del estadístico de
prueba, entonces el valor p es
P=
2 [1 – Φ (|Z0|)]
para una prueba de dos colas: H0:μ =μ0 H1:μ ≠ μ0
1 - Φ (Z0)
para una prueba de cola superior: H0:μ =μ0 H1:μ > μ0
Φ (Z0)
para una prueba de cola inferior: H0:μ =μ0 H1:μ < μ0
22
Prueba de Hipótesis
En las expresiones anteriores, Φ(z) es la función de distribución acumulada normal
estándar
No siempre resulta sencillo calcular el valor exacto de P para una prueba. Sin
embargo, muchos programas de computadora modernos para análisis estadístico
notifican valores P, y éstos también pueden obtenerse con algunas calculadoras de mano.
Finalmente, si se utiliza el enfoque del valor P, entonces puede modificarse el paso 6 del
procedimiento para la prueba de hipótesis. De manera especifica, no es necesario
plantear explícitamente la región critica.
En muchos problemas de ingeniería, se tiene interés en una variable aleatoria que
sigue una distribución binomial. Por ejemplo, considérese un proceso de producción que
fabrica artículos que son clasificados como aceptables o defectuosos. Lo usual y más
razonable es modelar la ocurrencia de artículos defectuosos con la distribución binomial,
donde el parámetro binomial p representa la proporción de artículos defectuosos
producidos. En consecuencia, muchos problemas de decisión en ingeniería incluyen una
prueba de hipótesis con respecto a p.
Considérese la prueba
H0:p =p0
H1:p ≠ p0
A continuación se proporciona una prueba basada en la aproximación normal de una
distribución binomial. Este procedimiento aproximado es válido siempre y cuando p no
sea muy próximo a cero o uno, y si el tamaño de la muestra es relativamente grande. Sea
X el número de observaciones en una muestra aleatoria de tamaño n que pertenece a la
clase asociada con p . Entonces, si la hipótesis nula H0:p=p0 es verdadera, se tiene que X
~ N (np0, np0(1 – p0)), aproximadamente. Para probar H0:p =p0, se calcula el estadístico de
prueba
Y se rechaza H0:p =p0 si
23
Prueba de Hipótesis
Z0 > Zα/2
o Z0 < - Zα/2
Las regiones críticas para las hipótesis alternativas unilaterales se construyen de la
manera usual.
PRUEBAS DE HIPÓTESIS SOBRE LA VARIANZA
Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de
una población. En esta parte se presentala hipótesis de que la población es normal.
Procedimientos de prueba para una población normal: Supóngase que se desea
probar la hipótesis de que la varianza de una población normal σ 2 es igual a un valor
específico, por ejemplo, σ2. Sea X1, X2
...
Xn, una muestra aleatoria de n observaciones
tomadas de esta población. Para probar
H0:σ2 =σ20
H1:σ2 ≠ σ20
se utiliza el estadístico de prueba
X20 = ( n – 1 ) S2
σ20
donde S2 es la varianza muestral. Ahora, si H0:σ2 =σ20 es verdadera, entonces el
estadístico de prueba X20 sigue una distribución ji-cuadrada con n - 1 grados de libertad.
Por consiguiente, se calcula el valor de la estadística de prueba X20, y la hipótesis H0:σ2
=σ20 debe rechazarse si
X20 > X2α/2,n - 1
o si
X20 > X2 1 -α /2,n - 1
donde X20 > X2α/2,n - 1 y X20 > X2 1 -α /2,n - 1 son los puntos que corresponden a los porcentajes
100 α/2 inferior y superior de la distribución ji-cuadrada con n- 1 grados de libertad,
24
Prueba de Hipótesis
respectivamente, El mismo estadístico de prueba se utiliza para hipótesis alternativas
unilaterales. Para la hipótesis unilateral
H0:σ2 =σ20
H1:σ2 ≠ σ20
se rechaza H0 si ,
X20 > X2α/2,n - 1
Para la otra hipótesis unilateral
H0:σ2 =σ20
H1:σ2 < σ20
se rechaza H0 si
X20 > X2 1 -α /2,n - 1
25
Prueba de Hipótesis