Download Práctica 4 CONTRASTE DE HIPÓTESIS

Document related concepts

Contraste de hipótesis wikipedia , lookup

Prueba t de Student wikipedia , lookup

Valor p wikipedia , lookup

Significación estadística wikipedia , lookup

Análisis de la varianza wikipedia , lookup

Transcript
AMPLIACIÓN DE ESTADÍSTICA
Departamento de Métodos Cuantitativos e Informáticos
Práctica 4
CONTRASTE DE HIPÓTESIS
1. Objetivos:
a) Calcular los parámetros de la distribución de medias o proporciones muestrales de
tamaño n, extraídas de una población de media y varianza conocidas.
b) Calcular el intervalo de confianza para la media con varianza conocida y desconocida.
c) Hallar el intervalo de confianza para la varianza con media desconocida.
d) Calcular el intervalo de confianza para la diferencia de medias con varianzas
conocidas y desconocidas pero iguales.
e) Utilizar distintos tamaños muestrales para controlar el nivel de confianza y el error
máximo admitido.
2. Introducción a los contrastes de hipótesis:
Partimos de una población de la que estudiamos una característica mediante una v.a. X de la
que conocemos su función de distribución F(x; θ ) salvo un parámetro “ θ ”. Planteamos cierta
hipótesis sobre el verdadero valor del parámetro θ ∈ Ω . A continuación extraemos una m.a.s.
de la v.a. X y, a partir de ella, aceptamos o rechazamos la hipótesis planteada usando el
criterio del contraste adecuado.
Por tanto, podemos definir un test o contraste de hipótesis como una regla o procedimiento
que nos permite aceptar o rechazar una hipótesis planteada sobre el parámetro desconocido
mediante una muestra aleatoria simple de la población.
3. Elementos que intervienen en un contraste de hipótesis
¾ Hipótesis Nula : es lo que queremos verificar. Se representa por Ho.
¾ Hipótesis Alternativa: es lo contrario a lo que queremos comprobar. Se
representa por H1.
¾ Región de aceptación: conjunto de realizaciones muestrales para las que
aceptamos la hipótesis nula H0.
¾ Región de rechazo: conjunto de realizaciones muestrales para las que
rechazamos la hipótesis nula H0.
¾
De forma general todo contraste de hipótesis lo podemos expresar de la forma:
Ω o ∪ Ω1 = Ω
H O :θ ∈ ΩO 
 donde
Ω o ∩ Ω1 = Φ
H 1 : θ ∈ Ω1 
3.1. Tipos de contrastes de hipótesis
a)
H o : θ = θ o 
Bilaterales o de dos colas: 
 .
H 1 : θ ≠ θ o 
siendo α = nivel de significación y
1-α = nivel de confianza.
1
AMPLIACIÓN DE ESTADÍSTICA
Departamento de Métodos Cuantitativos e Informáticos
Práctica 4
CONTRASTE DE HIPÓTESIS
b)
H o : θ ≤ θ o 
Unilateral derecho o de una cola: 
 .
H 1 : θ > θ o 
siendo α = nivel de significación y
1-α = nivel de confianza.
c)
H o : θ ≥ θ o 
Unilateral izquierdo o de una cola: 
 .
H 1 : θ < θ o 
siendo α = nivel de significación y
1-α = nivel de confianza.
4. Pasos para resolver un contraste de hipótesis
a) Plantear las hipótesis: Bilateral o unilateral
b) Elección del estadístico adecuado al contraste: Se calcula el valor del estadístico
en una realización muestral.
X −µ
Para contraste de media con varianza conocida se usa Z =
≡ N (0;1) .
σ
c) Cálculo de la región de aceptación: depende del tipo de contraste y del tipo de
estadístico.
d) Verificación: comprobar si el estadístico pertenece a la región de aceptación.
e) Decisión: aceptamos o rechazamos H0.
5. Tipos de errores
A partir de la información contenida en una muestra observada de la v.a. X, podemos
ACEPTAR O RECHAZAR Ho. Se pueden cometer dos tipos de errores:
El tratamiento de ambos errores no es el mismo, es decir, un error tiene más importancia
que el otro. El ejemplo típico es el de un juicio, donde:
H0: El acusado es inocente
H1 : El acusado es culpable
2
AMPLIACIÓN DE ESTADÍSTICA
Departamento de Métodos Cuantitativos e Informáticos
Práctica 4
CONTRASTE DE HIPÓTESIS
α =ERROR tipo I = P( RHo | siendo verdadera)=P( condenar siendo inocente)
β = ERROR tipo II = P( Aceptar Ho | siendo falsa) = P ( absolver siendo culpable)
El test óptimo sería aquel en el que no puede cometerse ningún error, es decir, α= β .
Para n fijo, cuando aumenta α disminuye β . Por ello, en general, no es posible obtener el
test óptimo.
El número α, llamado nivel de significación, puede fijarse dependiendo de la importancia
que le demos al error tipo I. Los valores más comunes son
α =0.1,0.05,0.01 y 0.001.
α indica la fuerza con la que se rechaza Ho, pudiéndose fijar el valor que se quiera.
Así, si rechazamos Ho para α =0.1 será menos significativo que si rechazamos Ho para a
=0.001.Recíprocamente, si α =0.001 es más fácil que aceptemos Ho (por ser fuerza de
rechazo menor) que si α =0.1.
Por tanto, la aceptación de la hipótesis nula no debe verse como una demostración de que
ésta es cierta, sino como que “ no se dispone de pruebas suficientes que demuestren su
falsedad”.
En el caso del juicio, si se declara culpable al acusado debe hacerse con una probabilidad
pequeña de error tipo I, que nosotros fijamos de antemano, mientras que si es declarado
inocente , esto no quiere decir que hayamos probado su inocencia sino que no se ha podido
probar su culpabilidad.
6. Contrastes de hipótesis en poblaciones normales N(µ , σ)
Para una muestra de tamaño n y un nivel de confianza 1- α
6.1. Contraste de hipótesis para µ conocida σ
Η0
Η1
µ ≤µ0
µ >µ0
µ ≥µ0
µ <µ0
µ =µ0
µ ≠µ0
ESTIMADOR
Z=
X−µ
σ
≡ N (0;1)
n
RECHAZAR H0 SI:
Ζ > Ζα
Ζ < −Ζα
Ζ > Ζα/2 ó Ζ < −Ζα/2
6.2. Contraste de hipótesis para µ desconocida σ
Η0
Η1
µ ≤µ0
µ >µ0
µ ≥µ0
µ <µ0
µ =µ0
µ ≠µ0
ESTIMADOR:
t=
X−µ
→ t n −1
s
n −1
RECHAZAR H0 SI:
t > t n-1,α
t < −tn-1, α
t > t n-1,α/2
ó t < −tn-1, α/2
3
AMPLIACIÓN DE ESTADÍSTICA
Departamento de Métodos Cuantitativos e Informáticos
Práctica 4
CONTRASTE DE HIPÓTESIS
6.3. Contraste de hipótesis para σ2 conocida µ
Η0
Η1
σ ≤σ0
σ >σ0
σ ≥σ0
σ <σ0
σ =σ0
σ ≠σ0
ESTIMADOR:
∑ (X
X =
− µ)
I
RECHAZAR H0 SI:
X > X2 n,α
2
≡ℵ
σ 02
2
n
X < X2 n,α
X > X2 n,α/2
ó X < X2 n,1-α/2
6.4. Contraste de hipótesis para σ2 desconocida µ
Η0
Η1
σ ≤σ0
σ >σ0
σ ≥σ0
σ <σ0
σ =σ0
σ ≠σ0
ESTIMADOR:
∑ (X
X=
I
−X
)
RECHAZAR H0 SI:
X > X2 n-1,α
2
σ 02
≡ℵ
2
n −1
X < X2 n-1,α
X > X2 n-1,α/2
ó X < X2 n-1,1-α/2
6.5. Intervalo de confianza para µ1−µ2 conocidas σ1, σ2
Η0
Η1
µ1 − µ2 =δ ≤ δ0
µ1 − µ2 =δ > δ0
µ1 − µ2 =δ ≥ δ0
µ1 − µ2 =δ < δ0
µ1 − µ2 =δ = δ0
µ1 − µ2 =δ ≠ δ0
ESTIMADOR
Z=
(X − Y ) − δ
σ 12
n
+
σ 22
0
RECHAZAR H0 SI:
Ζ > Ζα
≡ N (0;1)
m
Ζ < −Ζα
Ζ > Ζα/2 ó Ζ < −Ζα/2
6.6. Intervalo de confianza para µ1−µ2 desconocidas (σ1, σ2) pero iguales ( σ1, =σ2 )
Η0
Η1
µ1 − µ2 =δ ≤ δ0
µ1 − µ2 =δ > δ0
µ1 − µ2 =δ ≥ δ0
µ1 − µ2 =δ < δ0
µ1 − µ2 =δ = δ0
µ1 − µ2 =δ ≠ δ0
ESTIMADOR
t=
(X − Y ) − δ
0
ns12 + ms22
nm(n + m − 2)
n+m
RECHAZAR H0
SI:
≡ tn+ m−2
t > t n+m-2,α
t < −tn+m-2, α
t > t n+m-2,α/2 ó
t < −tn+m-2,α/2
4
AMPLIACIÓN DE ESTADÍSTICA
Departamento de Métodos Cuantitativos e Informáticos
Práctica 4
CONTRASTE DE HIPÓTESIS
7. Contraste de hipótesis usando EXCEL:
7.1. Inversa de la Función de distribución Normal
=DISTR.NORM.INV(probabilidad;media;desv_estándar)
Devuelve el inverso de la distribución acumulativa normal para la media y desviación
estándar especificadas.
¾ Sintaxis
DISTR.NORM.INV(probabilidad;media;desv_estándar)
Probabilidad es una probabilidad correspondiente a la distribución normal.
Media es la media de la distribución.
Desv_estándar es la desviación típica de la distribución.
¾ Ejemplo
Datos
Descripción
A2 = 0,908789
Probabilidad correspondiente a la distribución normal
A3 = 40
Media de la distribución
A4 =1,5
Desviación típica de la distribución
Fórmula
Descripción (Resultado)
=DISTR.NORM.INV(A2;A3;A4)
Inversa de la Función de distribución normal:
7.2. Inversa de la función de distribución de una Chi-cuadrado
= PRUEBA.CHI.INV(probabilidad;grados_de_libertad)
Devuelve, para una probabilidad dada, el valor de la variable aleatoria siguiendo una
distribución chi cuadrado. Si el argumento probabilidad = DISTR.CHI(x;...), entonces
PRUEBA.CHI.INV(probabilidad,...) = x.
¾ Sintaxis
PRUEBA.CHI.INV(probabilidad;grados_de_libertad)
Probabilidad es una probabilidad asociada a la distribución chi cuadrado.
Grados_de_libertad es el número de grados de libertad.
¾ Ejemplo: en la práctica2.
5
AMPLIACIÓN DE ESTADÍSTICA
Departamento de Métodos Cuantitativos e Informáticos
Práctica 4
CONTRASTE DE HIPÓTESIS
7.3. Inversa de la función de distribución de una t de Student
Devuelve el valor t de la distribución t de Student como función de la probabilidad y los
grados de libertad.
¾ Sintaxis
=DISTR.T.INV(probabilidad;grados_de_libertad)
Probabilidad es el nivel de significación α (dos colas) y 2*α ( 1 cola)
Grados_de_libertad es el número de grados de libertad de la distribución.
¾ Observaciones
Puede calcularse un valor t de una cola reemplazando probabilidad por 2*probabilidad. Para
una nivel de significación de 0,05 y grados de libertad de 10, el valor de dos colas se calcula
con DISTR.T.INV(0,05;10), que devuelve 2,28139. El valor de una cola para la misma
probabilidad y los mismos grados de libertad puede calcularse con DISTR.T.INV(2*0,05;10),
que devuelve 1,812462.
¾ Ejemplo
Datos
Descripción
A2= 0,054645 = α
Nivel de significación para t de Student de dos colas.
A3 = 60
Grados de libertad
Fórmula
Descripción (Resultado)
=DISTR.T.INV(A2;A3)
Valor t α =1,959997462
2
6
AMPLIACIÓN DE ESTADÍSTICA
Departamento de Métodos Cuantitativos e Informáticos
Práctica 4
CONTRASTE DE HIPÓTESIS
8. Caso práctico
8.1. Contraste de hipótesis en una población Normal :
8.1.1. Crea una hoja de cálculo (HOJA1) mediante la cual se pueda realizar cualquier
contraste de hipótesis (unilateral o bilateral) para la media de un población con varianza
conocida. Utilizando la HOJA1 resuelve el siguiente problema:
Un exportador de tomates empaqueta cajas que en término medio deben pesar 2 kg. Con
una desviación típica de 0,15 kg. Reciente se ha producido una avería en la máquina de
empaquetado que hace pensar que el peso medio ha podido cambiar. Para verificarlo se
extrae una m.a..s. de pesos recogida en la HOJA 1. Suponiendo que la distribución de
pesos sigue una distribución normal, se pide:
i. Contrastar si el peso medio es igual, mayor o igual, o menor o igual que 2 kg al nivel
de confianza del 90%, 95% y 99%.
ii. Repetir el apartado anterior para 2,25 kg.
8.1.2. Crea una hoja de cálculo (HOJA2) mediante la cual se pueda realizar cualquier
contraste de hipótesis (unilateral o bilateral) para la media de una población con varianza
desconocida. Utilizando la HOJA 2 resuelve el siguiente problema:
Una revista de gastronomía desea calificar los restaurantes de los restaurantes una región
según la puntuación que recibe por parte de los usuarios. El baremo utilizado es el
siguiente:
Media
Clasificación
≥ 7,5
Tres tenedores
5 ≤ µ < 7,5
Dos tenedores
µ <5
Un tenedor
Para evaluar un restaurante en particular se han recogido las puntuaciones que aparecen en
la HOJA 2. Suponiendo que las puntuaciones siguen una distribución Normal, determine cuál
es la clasificación de este restaurante con un nivel del confianza del 99%.
8.1.3. Crea una hoja de cálculo (HOJA3) mediante la cual se pueda resolver cualquier
contraste de hipótesis (unilateral o bilateral) para la diferencia de medias con varianzas
desconocidas pero iguales. Utilizando la HOJA 3 resuelve el siguiente problema:
Una empresa de muebles puede acudir a dos proveedores de madera, A y B. Conservará al
proveedor A si la media de su tiempo de entrega es igual o menor que del proveedor B y se
supone que las varianzas son iguales. El proveedor B afirma que ha incorporado una nueva
tecnología que reduce su tiempo de entrega medio sin alterar la varianza. La empresa decide
simultanear sus pedidos a cada proveedor y obtiene los tiempos de entrega recogidos en la
HOJA 3.
Sabiendo que los tiempos de entrega se distribuyen según una normal y de acuerdo con los
datos maestrales, ¿debería la empresa cambiar de proveedor al nivel 1% y 5%?
7