Download Introducción a la Estadística y al Análisis de Datos

Document related concepts

Poder estadístico wikipedia , lookup

Prueba t de Student wikipedia , lookup

Contraste de hipótesis wikipedia , lookup

Prueba de Bartlett wikipedia , lookup

Prueba de Levene wikipedia , lookup

Transcript
Pruebas de Hipótesis de Una y Dos
Muestras
UCR – ECCI
CI-1352 Probabilidad y Estadística
Prof. M.Sc. Kryscia Daviana Ramírez Benavides
Hipótesis Estadísticas
Conceptos Generales

En algunos casos el científico o el ingeniero necesitan la
formación de un procedimiento de decisión que se base en los
datos, el cual ofrezca una conclusión acerca de algún sistema
científico.



Se postula o conjetura algo acerca de un sistema.
Se deben incluir el uso de datos experimentales y la toma de
decisiones basadas en ellos.
De manera formal la conjetura se puede poner en forma de
hipótesis estadística.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
2
Hipótesis Estadísticas
Conceptos Generales (cont.)



Una hipótesis estadística es una aseveración o conjetura con
respecto a una o más poblaciones.
La verdad o falsedad de una hipótesis estadística nunca se
sabe con absoluta certidumbre, a menos que examinemos toda
la población; lo cual es poco práctico en la mayoría de la
situaciones.
Por lo cual, se toma una muestra aleatoria de la población de
interés, y se utilizan los datos contenidos en esta muestra para
proporcionar evidencia que apoye o no la hipótesis.

La evidencia de la muestra que sea inconsistente con la hipótesis que se
establece conduce al rechazo de la misma.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
3
Hipótesis Estadísticas
Conceptos Generales (cont.)

Un procedimiento de decisión debe hacerse con la noción de
la probabilidad de una conclusión errónea.




El rechazo de una hipótesis simplemente implica que la evidencia de la
muestra la refuta.
El rechazo significa que hay una pequeña probabilidad de obtener la
información muestral observada cuando, de hecho, la hipótesis es
verdadera.
Como resultado, el analista de los datos establece una
conclusión firme cuando se rechaza una hipótesis.
Cuando el análisis de datos formaliza la evidencia
experimental con base en la prueba de hipótesis, es muy
importante la declaración o el establecimiento formal de la
hipótesis.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
4
Hipótesis Estadísticas
Conceptos Generales (cont.)




La estructura de la prueba de hipótesis se formula usando el
término hipótesis nula, el cual se refiere a cualquier hipótesis
que se desea probar y se denota con H0.
El rechazo H0 de conduce a la aceptación de la hipótesis
alternativa, que se denota con H1.
La hipótesis alternativa H1 representa la pregunta que se
debe responder o la teoría que se debe probar y, por ello,
su especificación es muy importante.
La hipótesis nula H0 anula o se opone a H1, y a menudo es el
complemento lógico para H1.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
5
Hipótesis Estadísticas
Conceptos Generales (cont.)

El analista llega a una de las dos conclusiones siguientes:





Rechace H0: A favor de H1 debido a evidencia suficiente en los datos.
No rechace H0: Debido a evidencia insuficiente en los datos.
Las conclusiones no implican una “aceptación” formal o
literal de H0, a menudo representa el “status quo” contrario a
una nueva idea, conjetura, etc., enunciada en H1.
En tanto que no rechazar H1 representa la conclusión
adecuada.
Por lo general, la hipótesis nula se plantea de tal modo que
especifique un valor exacto del parámetro.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
6
Hipótesis Estadísticas
Conceptos Generales (cont.)


El mejor ejemplo para entender la prueba de hipótesis es el
veredicto de un jurado.
La hipótesis nula y alternativa son:



H0: el acusado es inocente.
H1: el acusado es culpable.
La acusación proviene de una sospecha de culpabilidad.


La hipótesis H0 (status quo) se establece en oposición a H1 y se
mantiene a menos que se apoye H1 con evidencia “más allá de una duda
razonable”.
El no rechazo de H0 no implica inocencia, sino que la evidencia fue
insuficiente para lograr una condena. De esta manera el jurado no
necesariamente acepta H0, sino que no la rechaza.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
7
Prueba de una Hipótesis Estadística


Una prueba o contraste de una hipótesis estadística es una
regla o procedimiento que conduce a una decisión de aceptar o
rechazar cierta hipótesis con base en los resultados de una
muestra.
Los procedimientos de prueba de hipótesis dependen del
empleo de la información contenida en una muestra aleatoria
de la población de interés.


Si esta información es consistente con la hipótesis se concluye que es
verdadera.
En caso contrario, la información es inconsistente con la hipótesis, se
concluye que es falsa.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
Prueba de una Hipótesis Estadística (cont.)

Estadístico de prueba. Valor obtenido a partir de la
información muestral, se utiliza para determinar si se rechaza
o no la hipótesis.



Región crítica. Región de rechazo de la hipótesis nula H0.


Toda prueba de hipótesis lleva implícita un estadístico para probarla.
Este estadístico depende del problema planteado y de la codificación
de las variables.
Se denomina C (subconjunto del espacio muestral) a la región crítica
de una prueba dada si nos lleva a rechazar la hipótesis nula H0
cuando la muestra cae en la región C.
Valor crítico. El punto que divide la región de aceptación y la
región de rechazo de la hipótesis nula H0.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
Prueba de una Hipótesis Estadística (cont.)




Nivel de significancia. Probabilidad de rechazar la hipótesis
nula cuando es verdadera. Se denota con α.
Error Tipo I. Rechazar la hipótesis nula cuando en realidad
es verdadera. La probabilidad de cometer un error tipo I se le
llama nivel de significancia.
Error Tipo II. Aceptar la hipótesis nula cuando en realidad es
falsa.
La probabilidad de cometer el error tipo II es imposible de
calcular a menos que tengamos una hipótesis alternativa
específica. Se denota con β.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
Prueba de una Hipótesis Estadística (cont.)

Al probar cualquier hipótesis estadística, hay cuatro
situaciones posibles que determinan si nuestra decisión es
correcta o errónea (ver la siguiente tabla).
Situaciones Posibles
Decisiones Posibles
H0 verdadera
H0 falsa
No rechazar H0
Decisión correcta
Error tipo II
Rechazar H0
Error tipo I
Decisión correcta
α = P(error tipo I ) = P(Rechazar H 0 H 0 verdadera ) = P(Muestra dentro de C H 0 )
β = P(error tipo II) = P(No rechazar H 0 H 0 falsa ) = P(Muestra fuera de C H1 )
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
11
Prueba de una Hipótesis Estadística (cont.)



Los valores para la significancia de una prueba de uso más
común son 0.01, 0.05 y 0.10; o sea, el investigador está
dispuesto a permitir 1%, 5% o 10% de cometer un error tipo I.
Idealmente se desearía que la probabilidad de error tipo I fuera
igual a cero. Sin embargo, si se desea α = 0, nunca se podría
tomar la decisión de rechazar la hipótesis nula.
La decisión de rechazar la hipótesis nula es importante, ya que
la decisión se basa en una muestra y no en la población; por
lo cual existe la posibilidad de cometer un error tipo I.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
Prueba de una Hipótesis Estadística (cont.)
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
Prueba de una Hipótesis Estadística (cont.)

Propiedades importantes de una prueba de hipótesis:




Los errores tipo I y tipo II están relacionados. Por lo general, una
disminución en la probabilidad de uno tiene como resultado un
incremento en la probabilidad del otro.
El tamaño de la región crítica y, por lo tanto, la probabilidad de
cometer un error tipo I, siempre se puede reducir al ajustar el(los)
valor(es) crítico(s).
Un aumento en el tamaño de la muestra n reducirá a α y β de forma
simultánea.
Si la hipótesis nula es falsa, β es un máximo cuando el valor real de
un parámetro se aproxima al valor hipotético. Cuando más grande sea
la distancia entre el valor real y el valor hipotético, β será menor.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
Prueba de una Hipótesis Estadística (cont.)

La cantidad 1 – β se conoce como el poder de la prueba o
potencia, es la probabilidad de rechazar H0 cuando es falsa
(en realidad debe ser rechazada). Idealmente se quiere tener
pruebas cuyo poder sea alto.
∏ = 1 − β = P (Rechazar H 0 H 0 falsa ) = P (Muestra dentro de C H1 )

A menudo diferentes tipos de pruebas se comparan al
contrastar propiedades de potencia.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
Pruebas de Una y Dos Colas


Una prueba de cualquier hipótesis estadística, donde la
alternativa es unilateral como
H 0 : θ = θ0
H 0 : θ = θ0
o
H1 : θ > θ 0
H1 : θ < θ 0
se denomina prueba de una sola cola.
Por lo general, la región crítica para la hipótesis alternativa θ >
θ0 yace en la cola derecha de la distribución del estadístico de
prueba; en tanto que la región crítica para la hipótesis
alternativa θ < θ0 yace en la cola izquierda.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
16
Pruebas de Una y Dos Colas (cont.)



Una prueba de cualquier hipótesis estadística, donde la
alternativa es bilateral como
H 0 : θ = θ0
H1 : θ ≠ θ 0
se denomina prueba de dos colas.
La región crítica se divide en dos partes, que a menudo tienen
probabilidades iguales que se colocan en cada cola de la
distribución del estadístico de prueba.
La hipótesis alternativa θ ≠ θ0 establece que ya sea θ < θ0 o
que θ > θ0.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
17
Pruebas de Una y Dos Colas (cont.)


Ejemplo. Un fabricante de cierta marca de cereal de arroz
afirma que el contenido promedio de grasa saturada no excede
de 1.5 gramos. Establezca las hipótesis nula y alternativa a
utilizar para probar esta afirmación y determinar dónde se
localiza la región crítica.
Solución. La afirmación del fabricante se debe rechazar sólo
si μ es mayor que 1.5mg y no se debe rechazar si es menor o
igual que 1.5mg. La prueba es de una sola cola, el símbolo
mayor indica que la región crítica yace en la cola derecha de la
distribución de nuestro estadístico de prueba X. H 0 : µ = 1.5
H1 : µ > 1.5
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
18
Pruebas de Una y Dos Colas (cont.)


Ejemplo. Un fabricante de cierta marca de cereal de arroz
afirma que el contenido promedio de grasa saturada no excede
ni disminuye de 1.5 gramos. Establezca las hipótesis nula y
alternativa a utilizar para probar esta afirmación y determinar
dónde se localiza la región crítica.
Solución. La afirmación del fabricante se debe rechazar sólo
si μ es mayor o menor que 1.5mg y no se debe rechazar si es
igual que 1.5mg. La prueba es de dos colas, con la región
crítica dividida por igual en ambas colas de la distribución de
nuestro estadístico de prueba X . H 0 : µ = 1.5
H1 : µ ≠ 1.5
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
19
Uso de Valores P para la Toma de Decisiones en
la Prueba de Hipótesis


Un valor P es el nivel (de significancia) más bajo donde es
significativo el valor observado del estadístico de prueba.
El valor P es la probabilidad de observar un valor muestral tan
extremo o más que el valor observado, dado que la hipótesis
nula es verdadera.




Si el valor p es menor que el nivel de significancia, H0 se rechaza.
Si el valor p es mayor que el nivel de significancia, H0 no se rechaza.
Prueba de una cola: valor P = P(z el valor absoluto del
estadístico de prueba calculado)
Prueba de dos colas: valor P = 2P( z el valor absoluto del
estadístico de prueba calculado).
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
20
Uso de Valores P para la Toma de Decisiones en
la Prueba de Hipótesis (cont.)

Hipótesis clásica



α es fija.
El punto más importante en la conclusión de “rechazar H0” o “no
rechazar H0” es α.
Hipótesis con valor P



α no es fija.
Las conclusiones se obtienen con base en el tamaño del valor P según
la apreciación subjetiva del científico o ingeniero.
Los valores P son producidos por el moderno software
computacional.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
21
Uso de Valores P para la Toma de Decisiones en
la Prueba de Hipótesis (cont.)

Pasos de la prueba de hipótesis clásica, con probabilidad fija
del error tipo I





Establezca las hipótesis nula y alternativa.
Elija un nivel de significancia α fijo.
Seleccione un estadístico de prueba adecuado y establezca la región
crítica con base en α.
A partir de estadístico de prueba calculado, rechazar H0 si el
estadístico de prueba está en la región crítica, de otra manera, no
rechazar H0.
Obtenga conclusiones científicas y de ingeniería.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
22
Uso de Valores P para la Toma de Decisiones en
la Prueba de Hipótesis (cont.)

Pasos de la prueba de significancia, aproximación al valor P




Establezca las hipótesis nula y alternativa.
Elija un estadístico de prueba adecuado.
Calcule el valor P con base en los valores calculados del estadístico
de prueba.
Utilice el juicio con base en el valor P y reconozca el sistema
científico.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
23
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Conocida


Es conveniente estandarizar X e incluir de manera formal la
variables aleatoria normal estándar Z, donde
X −µ
Z=
σ n
Se sabe que bajo H0 (si μ = μ0), entonces X − µ 0 σ n
tiene una distribución n(X;0,1) y, por lo tanto, se puede utilizar
la expresión 

X − µ0
P − zα 2 <
< zα 2  = 1 − α
σ n


para escribir una región de aceptación adecuada.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
(
)(
)
24
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Conocida (cont.)



Prueba de hipótesis bilateral sobre la media.
H 0 : µ = µ0
H1 : µ ≠ µ 0
La región crítica está en
x − µ0
x − µ0
z=
> zα 2 o z =
< − zα 2
σ n
σ n
Si –zα/2 < z < zα/2 no se rechaza H0. El rechazo de H0 implica la
aceptación de H1. Con la definición de la región crítica habrá
la probabilidad α de rechazar cuando, en realidad, μ = μ0.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
25
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Conocida (cont.)

La región crítica se puede escribir en términos del promedio
calculado x .

Rechazar H0 si x < a o x > b , donde
a = µ 0 − zα 2


σ
n
y b = µ 0 + zα 2
σ
n
Ver la figura siguiente.
Las pruebas de hipótesis unilaterales sobre la media incluyen
el mismo estadístico que se describe en el caso bilateral. La
diferencia es que la región crítica sólo está en una cola de la
distribución normal estándar.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
26
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Conocida (cont.)
H 0 : µ = µ0
H1 : µ ≠ µ 0
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
27
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Conocida (cont.)



Prueba de hipótesis unilateral (cola izquierda) sobre la media.
H 0 : µ = µ0
H1 : µ < µ 0
La región crítica está en
x − µ0
z=
< − zα
σ n
Si z > –zα no se rechaza H0. El rechazo de H0 implica la
aceptación de H1, la señal que favorece H1 proviene de valores
pequeños de z. Con la definición de la región crítica habrá la
probabilidad α de rechazar cuando, en realidad, μ = μ0.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
28
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Conocida (cont.)

La región crítica se puede escribir en términos del promedio
calculado x .

Rechazar H0 si x < a, donde
a = µ 0 − zα
σ
n
H 0 : µ = µ0
H1 : µ < µ 0
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
29
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Conocida (cont.)



Prueba de hipótesis unilateral (cola derecha) sobre la media.
H 0 : µ = µ0
H1 : µ > µ 0
La región crítica está en
x − µ0
z=
> zα
σ n
Si z < zα no se rechaza H0. El rechazo de H0 implica la
aceptación de H1, la señal que favorece H1 proviene de valores
grandes de z. Con la definición de la región crítica habrá la
probabilidad α de rechazar cuando, en realidad, μ = μ0.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
30
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Conocida (cont.)

La región crítica se puede escribir en términos del promedio
calculado x .

Rechazar H0 si x > b , donde
b = µ 0 + zα
σ
n
H 0 : µ = µ0
H1 : µ > µ 0
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
31
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Desconocida (cont.)


Es conveniente estandarizar X e incluir de manera formal la
variables aleatoria T, con v = n – 1 grados de libertad, donde
X −µ
T=
s n
Se sabe que bajo H0 (si μ = μ0), entonces X − µ 0 s n
tiene una distribución t con v = n – 1 grados de libertad y, por
lo tanto, se puede utilizar la expresión


X − µ0
P − tα 2 <
< tα 2  = 1 − α
s n


para escribir una región de aceptación adecuada.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
(
)(
)
32
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Desconocida (cont.)



Prueba de hipótesis bilateral sobre la media.
H 0 : µ = µ0
H1 : µ ≠ µ 0
La región crítica está en
x − µ0
x − µ0
t=
> tα 2 o t =
< −tα 2
s n
s n
Si –tα/2 < t < tα/2 no se rechaza H0. El rechazo de H0 implica la
aceptación de H1. Con la definición de la región crítica habrá
la probabilidad α de rechazar cuando, en realidad, μ = μ0.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
33
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Desconocida (cont.)

La región crítica se puede escribir en términos del promedio
calculado x .

Rechazar H0 si x < a o x > b , donde
a = µ 0 − tα 2


s
s
y b = µ 0 + tα 2
n
n
Ver la figura siguiente.
Las pruebas de hipótesis unilaterales sobre la media incluyen
el mismo estadístico que se describe en el caso bilateral. La
diferencia es que la región crítica sólo está en una cola de la
distribución normal estándar.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
34
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Desconocida (cont.)
H 0 : µ = µ0
H1 : µ ≠ µ 0
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
35
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Desconocida (cont.)



Prueba de hipótesis unilateral (cola izquierda) sobre la media.
H 0 : µ = µ0
H1 : µ < µ 0
La región crítica está en
x − µ0
t=
< −tα
s n
Si t > –tα no se rechaza H0. El rechazo de H0 implica la
aceptación de H1, la señal que favorece H1 proviene de valores
pequeños de t. Con la definición de la región crítica habrá la
probabilidad α de rechazar cuando, en realidad, μ = μ0.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
36
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Desconocida (cont.)

La región crítica se puede escribir en términos del promedio
calculado x .

Rechazar H0 si x < a, donde
s
a = µ 0 − tα
n
H 0 : µ = µ0
H1 : µ < µ 0
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
37
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Desconocida (cont.)



Prueba de hipótesis unilateral (cola derecha) sobre la media.
H 0 : µ = µ0
H1 : µ > µ 0
La región crítica está en
x − µ0
t=
> tα
s n
Si t < tα no se rechaza H0. El rechazo de H0 implica la
aceptación de H1, la señal que favorece H1 proviene de valores
grandes de t. Con la definición de la región crítica habrá la
probabilidad α de rechazar cuando, en realidad, μ = μ0.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
38
Prueba de Hipótesis sobre Una Muestra
Referente a la Media
Varianza Poblacional Desconocida (cont.)

La región crítica se puede escribir en términos del promedio
calculado x .

Rechazar H0 si x > b , donde
s
b = µ 0 + tα
n
H 0 : µ = µ0
H1 : µ > µ 0
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
39
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Conocidas

Es conveniente estandarizar X 1 − X 2 e incluir de manera
formal la variables aleatoria normal estándar Z, donde
X 1 − X 2 − (µ1 − µ 2 )
Z=
σ 12 n1 + σ 22 n2
Se sabe que bajo H0 (si μ = μ0), entonces Z tiene una
distribución n(X;0,1) y, por lo tanto, se puede utilizar la
expresión


X 1 − X 2 − (µ1 − µ 2 )

< zα 2  = 1 − α
P − zα 2 <
2
2


σ
σ
+
n
n
1
1
2
2


(

)
(
)
para escribir una región de aceptación adecuada.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
40
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Conocidas (cont.)



Prueba de hipótesis bilateral sobre la media.
H 0 : µ1 − µ 2 = d 0
H1 : µ1 − µ 2 ≠ d 0
La región crítica está en
x1 − x 2 − d 0
x1 − x 2 − d 0
z=
< − zα 2
> zα 2 o z =
2
2
2
2
σ 1 n1 + σ 2 n2
σ 1 n1 + σ 2 n2
Si –zα/2 < z < zα/2 no se rechaza H0. El rechazo de H0 implica la
aceptación de H1. Con la definición de la región crítica habrá
la probabilidad α de rechazar cuando, en realidad, μ1 – μ2 = d0.
(
)
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
(
)
41
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Conocidas (cont.)

La región crítica se puede escribir en términos del promedio
calculado x1 − x 2.

Rechazar H0 si x1 − x 2 < a o x1 − x 2 > b, donde
a = d 0 − zα 2 σ 12 n1 + σ 22 n2 y b = d 0 + zα 2 σ 12 n1 + σ 22 n2

Las pruebas de hipótesis unilaterales sobre la media incluyen
el mismo estadístico que se describe en el caso bilateral. La
diferencia es que la región crítica sólo está en una cola de la
distribución normal estándar.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
42
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Conocidas (cont.)



Prueba de hipótesis unilateral (cola izquierda) sobre la media.
H 0 : µ1 − µ 2 = d 0
H1 : µ1 − µ 2 < d 0
La región crítica está en
x1 − x 2 − d 0
z=
< − zα
2
2
σ 1 n1 + σ 2 n2
Si z > –zα no se rechaza H0. El rechazo de H0 implica la
aceptación de H1. Con la definición de la región crítica habrá
la probabilidad α de rechazar cuando, en realidad, μ1 – μ2 = d0.
(
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
)
43
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Conocidas (cont.)



Prueba de hipótesis unilateral (cola derecha) sobre la media.
H 0 : µ1 − µ 2 = d 0
H1 : µ1 − µ 2 > d 0
La región crítica está en
x1 − x 2 − d 0
z=
> zα
2
2
σ 1 n1 + σ 2 n2
Si z < zα no se rechaza H0. El rechazo de H0 implica la
aceptación de H1. Con la definición de la región crítica habrá
la probabilidad α de rechazar cuando, en realidad, μ1 – μ2 = d0.
(
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
)
44
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Conocidas (cont.)

La región crítica se puede escribir en términos del promedio
calculado x1 − x 2.

Rechazar H0 si x1 − x 2 < a , donde
a = d 0 − zα σ 12 n1 + σ 22 n2

Rechazar H0 si
x1 − x 2 > b, donde
b = d 0 + zα 2 σ 12 n1 + σ 22 n2
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
45
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas Iguales

Es conveniente estandarizar X 1 − X 2 e incluir de manera
formal la variables aleatoria T con v = n1 + n2 – 1 grados de
libertad, donde
X 1 − X 2 − (µ1 − µ 2 )
s12 (n1 − 1) + s22 (n2 − 1)
T=
sp =
n1 + n2 − 2
s p 1 n1 + 1 n2
(
)
Se sabe que bajo H0 (si μ = μ0), entonces T tiene una
distribución t con v = n1 + n2 – 2 grados de libertad y, por lo
tanto, se puede utilizar la expresión


X
1 − X 2 − (µ1 − µ 2 )
< tα 2  = 1 − α
P − tα 2 <


1
+
1
s
n
n
1
2
p


para CI-1352
escribir
una región
de aceptación adecuada.
UCR-ECCI
Probabilidad
y Estadística

(
Pruebas de Hipótesis de Una y Dos Muestras
)
46
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas Iguales



Prueba de hipótesis bilateral sobre la media.
H 0 : µ1 − µ 2 = d 0
H1 : µ1 − µ 2 ≠ d 0
La región crítica está en
x1 − x 2 − d 0
x1 − x 2 − d 0
t=
> tα 2 o t =
< −tα 2
s p 1 n1 + 1 n2
s p 1 n1 + 1 n2
Si –tα/2 < t < tα/2 no se rechaza H0. El rechazo de H0 implica la
aceptación de H1. Con la definición de la región crítica habrá
la probabilidad α de rechazar cuando, en realidad, μ1 – μ2 = d0.
(
)
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
(
)
47
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas Iguales

La región crítica se puede escribir en términos del promedio
calculado x1 − x 2.

Rechazar H0 si x1 − x 2 < a o x1 − x 2 > b, donde
a = d 0 − tα 2 s p 1 n1 + 1 n2 y b = d 0 + tα 2 s p 1 n1 + 1 n2

Las pruebas de hipótesis unilaterales sobre la media incluyen
el mismo estadístico que se describe en el caso bilateral. La
diferencia es que la región crítica sólo está en una cola de la
distribución normal estándar.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
48
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas Iguales



Prueba de hipótesis unilateral (cola izquierda) sobre la media.
H 0 : µ1 − µ 2 = d 0
H1 : µ1 − µ 2 < d 0
La región crítica está en
x1 − x 2 − d 0
t=
< −tα
s p 1 n1 + 1 n2
Si t > –tα no se rechaza H0. El rechazo de H0 implica la
aceptación de H1. Con la definición de la región crítica habrá
la probabilidad α de rechazar cuando, en realidad, μ1 – μ2 = d0.
(
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
)
49
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas Iguales



Prueba de hipótesis unilateral (cola derecha) sobre la media.
H 0 : µ1 − µ 2 = d 0
H1 : µ1 − µ 2 > d 0
La región crítica está en
x1 − x 2 − d 0
t=
> tα
s p 1 n1 + 1 n2
Si t < tα no se rechaza H0. El rechazo de H0 implica la
aceptación de H1. Con la definición de la región crítica habrá
la probabilidad α de rechazar cuando, en realidad, μ1 – μ2 = d0.
(
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
)
50
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas Iguales

La región crítica se puede escribir en términos del promedio
calculado x1 − x 2.

Rechazar H0 si x1 − x 2 < a , donde
a = d 0 − tα s p 1 n1 + 1 n2

Rechazar H0 si
x1 − x 2 > b, donde
b = d 0 + tα s p 1 n1 + 1 n2
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
51
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas
Diferentes
Es conveniente estandarizar X 1 − X 2 e incluir de manera
formal la variables aleatoria T’ con v grados de libertad, donde
2
2
2
X 1 − X 2 − (µ1 − µ 2 )
s1 n1 + s2 n2
T '=
v=
2
2
2
2
2
2
s1 n1 (n1 − 1) + s2 n2 (n2 − 1)
s1 n1 + s2 n2
 Se sabe que bajo H0 (si μ = μ0), entonces T’ tiene una
distribución t aproximada con v grados de libertad
aproximados y, por lo tanto, se puede utilizar la expresión


(
)
µ
µ
X
X
−
−
−
1
2
1
2
P − tα 2 <
< tα 2  = 1 − α
2
2


s
n
s
n
+
1
1
2
2


para escribir una región de aceptación adecuada.

(
)
(
(
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
)
(
(
)
)
)
52
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas
Diferentes (cont.)



Prueba de hipótesis bilateral sobre la media.
H 0 : µ1 − µ 2 = d 0
H1 : µ1 − µ 2 ≠ d 0
La región crítica está en
x1 − x 2 − d 0
x1 − x 2 − d 0
t' =
< −tα 2
> tα 2 o t ' =
2
2
2
2
s1 n1 + s2 n2
s1 n1 + s2 n2
Si –tα/2 < t’ < tα/2 no se rechaza H0. El rechazo de H0 implica la
aceptación de H1. Con la definición de la región crítica habrá
la probabilidad α de rechazar cuando, en realidad, μ1 – μ2 = d0.
(
)
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
(
)
53
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas
Diferentes (cont.)

La región crítica se puede escribir en términos del promedio
calculado x1 − x 2.

Rechazar H0 si x1 − x 2 < a o x1 − x 2 > b, donde
a = d 0 − tα 2 s12 n1 + s22 n2 y b = d 0 + tα 2 s12 n1 + s22 n2

Las pruebas de hipótesis unilaterales sobre la media incluyen
el mismo estadístico que se describe en el caso bilateral. La
diferencia es que la región crítica sólo está en una cola de la
distribución normal estándar.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
54
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas
Diferentes (cont.)



Prueba de hipótesis unilateral (cola izquierda) sobre la media.
H 0 : µ1 − µ 2 = d 0
H1 : µ1 − µ 2 < d 0
La región crítica está en
x1 − x 2 − d 0
t' =
< −tα
2
2
s1 n1 + s2 n2
Si t’ > –tα no se rechaza H0. El rechazo de H0 implica la
aceptación de H1. Con la definición de la región crítica habrá
la probabilidad α de rechazar cuando, en realidad, μ1 – μ2 = d0.
(
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
)
55
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas
Diferentes (cont.)



Prueba de hipótesis unilateral (cola derecha) sobre la media.
H 0 : µ1 − µ 2 = d 0
H1 : µ1 − µ 2 > d 0
La región crítica está en
x1 − x 2 − d 0
t' =
> tα
2
2
s1 n1 + s2 n2
Si t’ < tα no se rechaza H0. El rechazo de H0 implica la
aceptación de H1. Con la definición de la región crítica habrá
la probabilidad α de rechazar cuando, en realidad, μ1 – μ2 = d0.
(
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
)
56
Prueba de Hipótesis sobre Dos Muestras
Referente a la Diferencia de Medias
Varianzas Poblacionales Desconocidas
Diferentes (cont.)

La región crítica se puede escribir en términos del promedio
calculado x1 − x 2.

Rechazar H0 si x1 − x 2 < a , donde
a = d 0 − tα s12 n1 + s22 n2

Rechazar H0 si
x1 − x 2 > b, donde
b = d 0 + tα s12 n1 + s22 n2
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
57
Elección del Tamaño de la Muestra para Probar
Medias

Prueba de hipótesis sobre una media, varianza poblacional
conocida

Caso de un sola cola (región crítica):
(
z
n=
α
+ zβ ) σ 2
2
δ
2
δ = µ − µ0
Nivel de significancia α

Potencia = 1 − β
Caso de dos colas (región crítica):
(
z
n≈
2
)
σ
+
z
α 2
β
2
δ
2
δ = µ − µ0
Nivel de significancia α
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
Potencia = 1 − β
58
Elección del Tamaño de la Muestra para Probar
Medias (cont.)

Prueba de hipótesis sobre dos medias, varianzas poblacionales
conocidas (n = n1 = n2)

Caso de un sola cola (región crítica):
(
z
n=
α
2
(
δ
2
+ z β ) σ 12 + σ 22
)
δ = µ − µ0
Nivel de significancia α

Potencia = 1 − β
Caso de dos colas (región crítica):
(
z
n≈
(
2
2
)
σ
σ
+
z
+
1
2
α 2
β
2
δ
)
2
Nivel de significancia α
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
δ = µ − µ0
Potencia = 1 − β
59
Elección del Tamaño de la Muestra para Probar
Medias (cont.)

Prueba de hipótesis sobre una media, varianza poblacional
desconocida


La distribución utilizada para estos cálculos se llama distribución t
no central.
La tabla A.8 da los tamaños muestrales necesarios para controlar los
valores α y β para diversos valores de
δ
µ − µ0
∆= =
σ
σ
Nivel de significancia α
Potencia = 1 − β
para los casos de una y de dos colas (región crítica).
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
60
Elección del Tamaño de la Muestra para Probar
Medias (cont.)

Prueba de hipótesis sobre dos medias, varianzas poblacionales
desconocidas iguales (n = n1 = n2)


La distribución utilizada para estos cálculos se llama distribución t
no central.
La tabla A.9 da los tamaños muestrales necesarios para controlar los
valores α y β para diversos valores de
δ
µ1 − µ 2 − µ 0
∆= =
σ
σ
Nivel de significancia α
Potencia = 1 − β
para los casos de una y de dos colas (región crítica).
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
61
Prueba de Hipótesis sobre Una Muestra
Referente a la Varianza

En este tipo de pruebas se trata con alguna de las siguientes
hipótesis:
H 0 : σ 2 = σ 02 H 0 : σ 2 = σ 02
H 0 : σ 2 = σ 02
,
o
2
2
2
2
H1 : σ ≠ σ 0 H1 : σ < σ 0
H1 : σ 2 > σ 02

Es estadístico apropiado sobre el que se basan las
conclusiones es el chi-cuadrado χ2.
χ

2
(
n − 1)s 2
=
σ 02
Si H0 es verdadera, χ2 es un valor de la distribución chicuadrada con v = n – 1 grados de libertad.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
62
Prueba de Hipótesis sobre Una Muestra
Referente a la Varianza (cont.)



Prueba de dos colas en el nivel de significancia α la región
crítica es χ2 < χ21-α/2 o χ2 > χ2α/2.
Prueba de una cola (izquierda) en el nivel de significancia α la
región crítica es χ2 < χ21-α.
Prueba de una cola (derecha) en el nivel de significancia α la
región crítica es χ2 > χ2α.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
63
Prueba de Hipótesis sobre Dos Muestras
Referente a la Razón entre Varianzas

En este tipo de pruebas se trata con alguna de las siguientes
hipótesis:
H 0 : σ 12 = σ 22 H 0 : σ 12 = σ 22
H 0 : σ 12 = σ 22
,
o
2
2
2
2
H1 : σ 1 ≠ σ 2 H1 : σ 1 < σ 2
H1 : σ 12 > σ 22

Es estadístico apropiado sobre el que se basan las
conclusiones es el valor f.

s12
f = 2
s2
Si H0 es verdadera, f es un valor de la distribución F con v1 =
n1 – 1 y v2 = n2 – 1 grados de libertad.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
64
Prueba de Hipótesis sobre Una Muestra
Referente a la Varianza (cont.)



Prueba de dos colas en el nivel de significancia α la región
crítica es f < f1-α/2(v1,v2) o f > fα/2(v1,v2).
Prueba de una cola (izquierda) en el nivel de significancia α la
región crítica es f < f1-α(v1,v2).
Prueba de una cola (derecha) en el nivel de significancia α la
región crítica es f > fα(v1,v2).
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
65
Referencias Bibliográficas

Walpole, R.E.; Myers, R.H.; Myers, S.L. & Ye, K.
“Probabilidad y estadística para ingeniería y ciencias”. Octava
Edición. Pearson Prentice-Hall. México, 2007.
UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras
66