Download Resueltos en abierto

Document related concepts
no text concepts found
Transcript
Muestreo. Inferencia Estadística. Test de hipótesis. Tipos de errores
1
INFERENCIA ESTADÍSTICA. TEST DE HIPÓTESIS.
TIPOS DE ERRORES
001.– PAU – SELECTIVIDAD – Universidad de Oviedo – Junio 1996
La empresa de transportes urgentes “El Rápido” asegura que entrega el 80% de sus envíos
antes de las 12 de la mañana. Para contrastar la calidad de este servicio, la asociación de
consumidores selecciona aleatoriamente 100 envíos en diversos días.
(a) Establecer la hipótesis nula y la alternativa.
(b) Describir en este caso en qué consistirían los errores tipo I y tipo II. ¿Cómo se denomina
la probabilidad de confundirnos de modo que la asociación acuse injustamente a la empresa de
no cumplir sus compromisos publicitarios?
(c) A partir de los datos de la muestra, el informe encargado por la asociación afirma que el
valor obtenido es significativo. ¿Cómo debe ser interpretado el resultado?
RESOLUCIÓN apartado (a)
Suponemos que la empresa, cuando menciona que entrega el 80% de los envíos, nos está
diciendo que entrega al menos el 80% de los envíos.
Planteamos las hipótesis:
H0: Hipótesis nula.
Hl: Hipótesis alternativa, complementa la hipótesis nula.
H0 : p ≥ 80 → El porcentaje de entregas SÍ es de, al menos, el 80%.
H1 : p < 80→ El porcentaje de entregas NO es de, al menos, el 80%.
Siendo p la proporción de entregas de sus envíos antes de las 12:00 de la mañana.
Las hipótesis así definidas suponen plantear una prueba de...
Contraste de hipótesis unilateral.
RESOLUCIÓN apartado (b)
Error tipo I:
Es la probabilidad de rechazar Ho siendo cierta.
P(I) = P[Rechazar H0 / cierta H0 ] = α
P(I) = P[No rechazar H1 / cierta H0 ] = α
En nuestro caso, se trata de rechazar la publicidad realizada por la empresa, siendo
cierta.
Error tipo II:
Es la probabilidad de rechazar H1 siendo cierta o también no rechazar H0 cuando es falsa.
P(II) = P[Rechazar H1 / cierta H1 ]
P(II) = P[No rechazar H0 / cierta H1 ]
En nuestro caso no rechazar la publicidad de la empresa cuando en realidad no es
cierta.
Después de que la asociación de consumidores realice un estudio, si acusa injustamente a
la empresa de no cumplir sus compromisos publicitarios (se rechaza H0) y realmente SÍ hacen
la entrega en los tiempos asegurados (es cierto H0) estaríamos cometiendo un error de tipo I.
RESOLUCIÓN apartado (c)
Si el valor obtenido en la prueba es significativo quiere decir que el valor obtenido del
estadístico cae dentro de la región de rechazo para un cierto valor de significación α, por lo que
nos llevaría a rechazar la hipótesis nula, es decir, se cree que el porcentaje de entregas NO es
de, al menos, el 80%, aunque sería interesante conocer (y exigir) el nivel de significación con el
que se está trabajando en la prueba.
 Abel Martín
2
Del aula a la PAU
002.– PAU – Universidad de Oviedo – SEPTIEMBRE 1996
La empresa empaquetadora de mariscos “El centollu” afirma que el peso medio de sus
productos supera los 400 gramos. Un restaurante consumidor habitual desea contrastar esta
Información.
(a) Enunciar la hipótesis nula y alternativa.
(b) Describir los errores tipo I y II en este caso.
(c) Sobre una muestra de 10 envases se ha observado un peso medio de 300 gramos. ¿Es
posible con esta información rechazar el supuesto de la empresa “El centollu”? ¿Sería
necesaria alguna información adicional para resolver el contraste?
RESOLUCIÓN apartado (a)
Planteamos las hipótesis:
H0: Hipótesis nula.
H1: Hipótesis alternativa, complementa la hipótesis nula.
H0 : µ0 ≥ 400 → El peso medio del marisco empaquetado SÍ supera los 400 gramos.
H1 : µ0 < 400 → El peso medio del marisco empaquetado NO supera los 400 gramos.
Siendo µ el peso medio de los productos de la empresa empaquetadora de mariscos “El
centollu”.
Las hipótesis así definidas suponen plantear una prueba de...
Contraste de hipótesis unilateral.
RESOLUCIÓN apartado (b)
Error tipo I:
Es la probabilidad de rechazar Ho siendo cierta.
P(I) = P[Rechazar H0 / cierta H0 ] = α
P(I) = P[No rechazar H1 / cierta H0 ] = α
Se rechaza la afirmación de la empresa de que el peso medio del marisco supera los
400 gramos (rechaza H0) siendo cierto (es cierto H0).
Error tipo II:
Es la probabilidad de rechazar H1 siendo cierta o también no rechazar H0 cuando es falsa.
P(II) = P[Rechazar H1 / cierta H1 ]
P(II) = P[No rechazar H0 / cierta H1 ]
Podríamos decirlo de varias formas:
(a) El error de tipo II consistiría en rechazar que no han superado los 400 gramos
(rechazar H1 ), cuando en realidad no los superan (es cierta H1).
(b) Considerar la veracidad de los datos proporcionados por la empresa, cuando en
realidad son falsos.
RESOLUCIÓN apartado (c)
Los datos proporcionados por el problema son, considerando la distribución normal:
Población → N(400, S)
Muestra → N(300, S) ; n = 10
La distribución que sigue la media muestral es la normal de parámetros:

Ŝ 
ℜ → N  µ,

n 

Y el valor del estadístico del contraste lo obtenemos tipificando la variable:
www.aulamatematica.com
Muestreo. Inferencia Estadística. Test de hipótesis. Tipos de errores
Z=
x-µ
Ŝ
3
→ N(0, 1)
n
Para resolver el contraste es necesario conocer el valor de la varianza muestral o bien
el de la varianza poblacional, así como haber prefijado el nivel de significación.
003.– PAU – Universidad de Oviedo – – JUNIO 1998
En los últimos tiempos las ventas medias en un comercio rondaban las 120 000 PTAS
diarias. Sin embargo, hace unos meses se abrió una superficie comercial cerca del mismo. El
establecimiento defiende que las ventas medias se mantienen o incluso han aumentado, pero
que no han disminuido. Para contrastar estadísticamente este supuesto se ha seleccionado
una muestra de las ventas diarias realizadas después de la apertura de la superficie comercial.
(a) Establecer las hipótesis nula y alternativa.
(b) ¿Qué nombre recibe la probabilidad de que el establecimiento concluya erróneamente
que las ventas medias han disminuido? Explica cómo se denomina y en qué consiste el otro
error posible.
(c) El establecimiento ha encargado el estudio a un especialista, y en su informe afirma,
textualmente, que “el valor obtenido al realizar el contraste es significativo”, pero el
establecimiento no entiende el significado de la frase. ¿Significa que el establecimiento debe
concluir que sus ventas medias disminuyeron, o es lo contrario?
RESOLUCIÓN apartado (a)
Planteamos las hipótesis:
H0: Hipótesis nula.
H1: Hipótesis alternativa, complementa la hipótesis nula.
H0 : µ0 ≥ 120 000 → La media de las ventas se mantienen o incluso han aumentado.
H1 : µ0 < 120 000 → La media de las ventas del comercio SÍ ha disminuido.
Siendo µ las ventas medias de dicho comercio, expresadas en pesetas.
Las hipótesis así definidas suponen plantear una prueba de...
Contraste de hipótesis unilateral.
RESOLUCIÓN apartado (b)
Error tipo I:
Es la probabilidad de rechazar Ho siendo cierta.
P(I) = P[Rechazar H0 / cierta H0 ]
Se rechaza la afirmación de que la media de las ventas se mantienen o incluso han
aumentado (rechaza H0) siendo cierto (es cierta H0). Estamos pues en un caso de ERROR
DE TIPO I
Error tipo II:
Es la probabilidad de rechazar H1 siendo cierta o también no rechazar H0 cuando es falsa.
P(II) = P[Rechazar H1 / cierta H1 ]
El error de tipo II consistiría en rechazar que las ventas en el comercio han disminuido
(rechaza H1) cuando en realidad sí han disminuido (cierta H1).
RESOLUCIÓN apartado (c)
Un resultado significativo quiere decir que el valor obtenido del estadístico cae dentro de la
región de rechazo para un cierto valor de significación α, por lo que nos llevaría a rechazar la
hipótesis nula, es decir, que concluiríamos que las ventas medias SÍ han disminuido, aunque
se debería exigir al especialista el nivel de significación con el que se está trabajando en la
prueba.
Criterios de corrección y calificación especificados en la prueba oficial:
(a) 0.75 puntos. (b) Cada tipo de error: 0.5 puntos
(c) 0,75 puntos.
 Abel Martín
4
Del aula a la PAU
004.– PAU – Universidad de Oviedo – – JUNIO 1999
La Concejalía de Juventud de un Ayuntamiento maneja el dato de que la edad a la que los
hijos se independizan de sus padres es una variable Normal con media 29 años y desviación
típica 3 años. Aunque la desviación típica no plantea dudas, sí se sospecha que la media ha
descendido, sobre todo por la política de ayuda al empleo que ha llevado a cabo el
Ayuntamiento. Así, de un estudio reciente sobre 100 jóvenes que se acaban de independizar,
se ha obtenido una media de 28.1 años de edad.
(a) Con un nivel de significación del 1% ¿puede defenderse que la edad media no ha
disminuido, frente a que sí lo ha hecho como parecen indicar los datos? Plantear el contraste o
test de hipótesis y resolverlo.
(b) Explicar, en el contexto del problema, en qué consisten cada uno de los errores del tipo I
y II.
(Algunos valores de la función de distribución de la Normal de media 0 y desviación típica 1:
F (100) = 1; F(3) = 0.999; F(2.33) = 0.99; F(0.01) = 0.504
RESOLUCIÓN apartado (a)
Los datos proporcionados por el problema son:
Población → N(29, 3)
Muestra → N(28.1, S) ; n = 100
1º PASO
Planteamos las hipótesis:
H0: Hipótesis nula.
H1: Hipótesis alternativa, complementa la hipótesis nula.
H0 : µ0 ≥ 29 → La edad media de los hijos independizados NO ha disminuido.
H1 : µ0 < 29 → La edad media de los hijos independizados SÍ ha disminuido.
Siendo µ la edad media a la que los hijos se independizan de sus padres.
2º PASO
El nivel de significación que nos determina el enunciado es del 1% → α = 0.01
El nivel de confianza es del 99% → 1 - α = 0.99
3º PASO
Las hipótesis así definidas suponen plantear una prueba de...
Contraste de hipótesis unilateral
Para α = 0.01 (1 - α = 0.99), según vemos en el enunciado [F(zα) = 0.99], le corresponde
un crítico de zα = 2.33
La hipótesis alternativa nos indica la dirección del contraste, es decir, la región de rechazo
de la hipótesis nula:
La región de rechazo será (- ∞, - 2.33)
4º PASO
Recordemos que los datos proporcionados por el problema son:
www.aulamatematica.com
Muestreo. Inferencia Estadística. Test de hipótesis. Tipos de errores
5
Población → N(29, 3)
;
Muestra → N(28.1, S) ; n = 100
La distribución que sigue la media muestral es la normal de parámetros:

σ 

ℜ → N  µ,
n


3 

N  29,
100 

N(29, 0.3)
5º PASO
Como no se trata de una N(0, 1), el valor del estadístico del contraste lo obtenemos
tipificando la variable...
x-µ
Z=
→ N(0, 1)
σ
n
Z=
28.1 - 29
=-3
0.3
6º PASO
Nuestro estadístico Z = - 3) cae dentro de la región de rechazo, por lo que rechazamos
la hipótesis nula, y al nivel del 1% podremos defender que la política de ayuda al empleo
que ha llevado a cabo el Ayuntamiento ha tenido su efecto y la edad media a la que los
hijos se independizan de sus padres SÍ ha disminuido.
RESOLUCIÓN apartado (b)
Explicar, en el contexto del problema, en qué consisten cada uno de los errores del tipo I y II
Error tipo I:
Es la probabilidad de rechazar Ho siendo cierta.
P(I) = P[Rechazar H0 / cierta H0 ]
Después de la política llevada a cabo por el Ayuntamiento, se rechaza que la media de
edad de independencia de los hijos no ha disminuido (se rechaza H0), siendo realmente
cierto (es cierto H0).
Error tipo II:
Es la probabilidad de rechazar H1 siendo cierta o también no rechazar H0 cuando es falsa.
P(II) = P[Rechazar H1 / cierta H1 ]
Después de la política llevada a cabo por el Ayuntamiento, se rechaza que la media de
edad de emancipación de los hijos ha disminuido (se rechaza H1) y realmente SÍ ha
disminuido (es cierto H1).
Criterios de corrección y calificación especificados en la prueba oficial:
(a) Plantear el contraste, 0.5 puntos. Resolverlo, 1 punto
 Abel Martín
(b) 0.5 puntos cada error.