Download Tema 3. INFERENCIA ESTADÍSTICA

Document related concepts

Distribución t de Student wikipedia , lookup

Intervalo de confianza wikipedia , lookup

Error estándar wikipedia , lookup

Estimación estadística wikipedia , lookup

Estadística paramétrica wikipedia , lookup

Transcript
Prácticas de Estadística. Curso 10/11
Inferencia
Tema 3. INFERENCIA ESTADÍSTICA
1. Genera 3 muestras de tamaño 100 de una distribución N(5,2).
(a) Calcula tres intervalos de conanza al 90% para la media poblacional.
(b) ¾Cuántos de los intervalos construidos contienen el verdadero valor de la media poblacional?
(c) Compara los resultados obtenidos con el resto de los compañeros.
2. Genera 3 muestras de tamaño 100, 200 y 500 de una distribución normal de parámetros 9 y 2.
(a) Calcula un intervalo de conanza al 95% de cada uno de los parámetros de la población, utilizando
alternativamente las tres muestras.
(b) Compara grácamente las amplitudes de los intervalos obtenidos.
¾A qué se deben las diferencias
observadas?
3. Genera una muestra de tamaño 100 de una distribución normal estándar.
(a) Construir intervalos de conanza al 75, 90 y 95% para la media y la varianza de la población de la
que procede dicha muestra.
(b) Compara grácamente las amplitudes de los intervalos obtenidos, e interpreta las diferencias encontradas.
4. Genera una muestra aleatoria de tamaño cien de una población normal de media 60 y desviación típica 1.
(a) ¾En qué intervalo teórico debería estar más del 99% de la muestra? ¾Realmente lo está?
(b) Calcula intervalos al 90, 95 y 99% de conanza para la media y la desviación típica de la población,
utilizando esta muestra.
¾Se encuentran los valores verdaderos de los parámetros dentro de estos
intervalos?
(c) ¾Sería contradictorio que los valores teóricos no estuvieran contenidos en los intervalos correspondientes?
(d) Contrasta la hipótesis de que la media de la población es 60, con un nivel de conanza del 95% (α =
0.05). ¾Sería contradictorio que el resultado del contraste fuera rechazar la hipótesis nula?
(e) Encuentra un nivel de signicación con el que se rechace que la media de la población es 60.
5. Desde un punto de vista práctico
(a) ¾Cómo interesa que sea la magnitud de la conanza de un intervalo?
(b) ¾Y su amplitud?
(c) ¾Qué es necesario hacer para conseguir optimizar simultáneamente estas características?
1
Prácticas de Estadística. Curso 10/11
Inferencia
NOTA: En los siguientes ejercicios se entenderá que las poblaciones en estudio siguen una distribución
Normal.
6. La fábrica RUEDA ha determinado que sus neumáticos tienen que medir en media 36 unidades de diámetro
para que se acomoden a la mayoría de los modelos de turismos.
Si no es así, la división de control de
calidad de RUEDA emprenderá acciones para garantizar que se cumplen las especicaciones de producción.
Una muestra aleatoria de 100 neumáticos dio una media de 36,4 unidades y una desviación típica de 2,1
unidades.
(a) Calcula intervalos de conanza para la media poblacional al 90, 95 y 99%.
(b) Comenta teóricamente cómo resultarían los intervalos si la muestra fuera de 50 neumáticos.
(c) Plantea y resuelve un contraste con
α=0,05,
para decidir si el proceso cumple las especicaciones.
(d) ¾La dirección de la fábrica tiene motivos para preocuparse?
7. De una distribución normal se tiene una muestra de tamaño 100 cuya media es 36,38 unidades y cuya
desviación típica muestral corregida es 2,07 unidades
(a) Haz una estimación puntual de los parámetros indicando el método seguido.
(b) Calcula intervalos de conanza para la media y la varianza poblacional al 90, 95 y 99%.
(c) Plantea y resuelve un contraste para decidir si se acepta que la media de la distribución normal es de
36 unidades.
(d) ¾Cómo cambiarían los apartados b) y c) si la muestra hubiera sido de tamaño 50?
8. La variable X representa la resistencia, en kΩ., de una marca de bombillas, donde X sigue una distribución
N(µ , 0.027). Se toma una muestra de tamaño 9 y se observan los siguientes resultados: 2.23; 2.21; 2.25 ;
2.22 ; 2.19 ; 2.20 ; 2.18 ; 2.22 ; 2.19.
(a) Calcula un intervalo de conanza para
(b) El fabricante asegura que
µ
µ
al 95%.
= 2.2 kΩ. Para discutir la armación del fabricante, dene un contraste
de hipótesis indicando cuál es la hipótesis nula, la hipótesis alternativa y realiza el contraste al 95%.
(c) Con los datos observados ¾hay contradicción con el valor supuesto para la varianza?
(d) Realiza un test de normalidad con papel probabilístico normal para estos datos.
9. Una empresa multinacional está realizando un estudio sobre la satisfacción de sus empleados en el trabajo,
en los distintos países en los que tiene establecidas delegaciones.
De una muestra aleatoria simple de
1000 trabajadores españoles, 420 declararon estar satisfechos con el trabajo; mientras que de otra muestra
aleatoria simple de 2000 trabajadores franceses, 800 estaban satisfechos.
(a) Indica en qué país hay mayor porcentaje estimado de trabajadores satisfechos.
(b) Indica si la conclusión del apartado anterior sigue siendo válida en base a los intervalos de conanza
del 95% de las estimaciones obtenidas en el apartado anterior.
2
Prácticas de Estadística. Curso 10/11
Inferencia
10. El Ministerio de Educación y Ciencia desea conocer la proporción de niños disléxicos existentes en las aulas
de los colegios públicos. Para ello toma, en dichos colegios, una muestra aleatoria simple de 2000 niños,
de los que 550 presentan problemas de dislexia.
(a) Da una es timación de la propporción buscada por el Ministerio y un intervalo de conanza del 95%.
(b) Si a priori no se sabe nada acerca de la proporción en estudio (considera el caso más desfavorable)
y se quiere que el intervalo de conanza del 95% tenga una amplitudinferior al 3% ¾Qué tamaño de
muestra habría que seleccionar?
11. Las especicaciones para cierta clase de viga exigen una resistencia media a la ruptura de 180 unidades.
Si cinco de las vigas (aleatoriamente seleccionadas) tienen una resistencia media de 165,9 unidades y una
desviación típica de 5,7 unidades, realiza un contraste con la hipótesis nula de que la media
a la hipótesis alternativa de que
µ 6=180
unidades, a un nivel
µ =180,
frente
α=0,01.
12. Se desea contrastar con un nivel de signicación del 5%, si la conductividad térmica en media de cierto
tipo de ladrillo es de 0,340 como se asegura. Para ello se tomó una muestra aleatoria de 35 neumáticos
que dieron una media de 0,343 unidades y una desviación típica de 0,01 unidades. ¾Qué contestarías?
13. Un constructor arma que se instalan bombas de calefacción en el 70% de todos los hogares actualmente
en construcción en la ciudad A. ¾Estarías de acuerdo con esta armación, si tomada una muestra de 300
casas nuevas en dicha ciudad resulta que 140 no tienen instaladas bombas de calefacción para un nivel
= 0,05? ¾y para
α
α
= 0,10?
14. Un supervisor de control de calidad en una enlatadora sabe que la cantidad exacta contenida en cada lata
varía, pues hay ciertos factores imposibles de controlar que afectan la cantidad de llenado. El llenado medio
por lata es importante, pero igualmente importante es la variación
σ2
de la cantidad de llenado. Si
σ2
es
grande, algunas latas contendrán muy poco y otras demasiado. Las normas especican que la desviación
típica de la cantidad de llenado debe ser 0,1 unidades. El supervisor de control de calidad muestreó 10
latas y midió la cantidad de llenado en cada una obteniendo los siguientes resultados: 7,56 ; 7,90 ; 7,98 ;
8,01 ; 7,97 ; 7,96 ; 8,03 ; 8,02 ; 8,04 ; 8,02 ¾Esta información proporciona pruebas sucientes, con un nivel
α
= 0,05, de que la desviación típica
σ
de las medidas de llenado es 0,1 unidades?
15. El empleo de acero tratado en la construcción de puentes para autopistas ha sido tema de considerable
controversia. Los críticos han citado recientemente graves problemas de corrosión en dicho acero y están
tratando de prohibir su uso en la construcción de puentes.
Por otro lado, las corporaciones del acero
aseguran que estas acusaciones son exageradas y dicen que el 95% de todos los puentes de acero tratado
tienen un buen comportamiento, sin daños graves por corrosión.
A n de probar esta aseveración, un
equipo de técnicos evaluó 60 puentes de acero tratado, seleccionados al azar y encontraron que 54 de ellos
tenían un buen comportamiento. ¾Hay evidencia, con un nivel
α
= 0,05, de que la verdadera proporción
de puentes de acero tratado que presentan un buen comportamiento sea del 95%?
3
Prácticas de Estadística. Curso 10/11
Inferencia
16. En el chero GRANIZO se encuentran las variables
altura
y
código.
La primera de ellas contiene los datos
relativos a la altura, en metros, de la zona más densa de 319 nubes, y la segunda un código que identica a
las nubes según provocan granizo (código igual a 1), o no (código igual a 0). Dichos datos fueron tomados
en Alicante, en el transcurso de un estudio contenido en un programa de lucha antigranizo . Suponiendo
aceptable la hipótesis de normalidad para las nubes que no provocan granizo:
(a) Calcula intervalos de conanza al 90, 95 y 99% para la media y la varianza de las alturas de las nubes
que no provocan granizo.
(b) Suponiendo que los datos sean una muestra representativa de la población. (¾Quién es en este caso la
población?). Construir un intervalo que contenga el 99% de las alturas de las nubes que no producen
granizo.
(c) ¾Se podría aceptar que las nubes que no producen granizo se sitúan a una altura media de 7.500
metros? ¾De qué depende la respuesta a esta pregunta?
(d) ¾Cuál sería la respuesta a la pregunta anterior si se quisiera contrastar que la altura media fuese:
6.700, 6.800, 6.900, 7.000, 7.600, 8.000 u 8.500 metros?
(e) ¾Cuáles son los niveles de signicación (p-valores o niveles críticos) de los contrastes anteriores?
(f ) ¾Qué habría que hacer para aceptar el contraste de que la altura media de estas nubes es de 6.800
metros? ¾Y para rechazarlo? ¾Y con 6.700 metros?
(g) ¾Qué relación hay entre el nivel de signicación de un contraste y el intervalo de conanza utilizado
como referencia?
(h) Calcula la probabilidad de que una nube que no granice circule entre 7.000 y 7.500 metros. ¾Y la
probabilidad de que circule a menos de 6.000 metros?.
17. En el ejercicio anterior se ha aceptado que los datos de la muestra, altura de las nubes que no provocan
granizo, proceden de una población normal.
(a) Construye un histograma de los datos y analiza si pueden provenir de una población normal.
(b) Realiza el Test de la
χ2
para analizar la hipótesis de normalidad. ¾Con qué grado de evidencia se
acepta o rechaza la hipótesis de normalidad?
(c) ¾Se obtienen resultados similares si se contrasta normalidad por medio del Test de KolmogorovSmirnov?
(d) ¾Se pueden aceptar los resultados del ejercicio anterior?
18. En el archivo ANTEBRAZOS se encuentran las longitudes de los antebrazos, en pulgadas, de 140 hombres
adultos.
(a) Discute con un contraste adecuado la normalidad de la distribución
(b) Obtén intervalos de conanza al 90, 95 y 99% para la media, la desviación típica y la varianza de la
población de la que los datos son una muestra.
(c) Interpreta el signicado de los intervalos obtenidos en el apartado anterior y explica las diferencias
que encuentres entre ellos.
4
Prácticas de Estadística. Curso 10/11
Inferencia
19. Un experto en ordenadores, tratando de optimizar la operación de un sistema, reunió en el archivo MICROSEGUNDOS 50 medidas sobre el tiempo en microsegundos entre las solicitudes de servicio de un
proceso. Analiza si es razonable suponer que provienen de una distribución normal mediante:
(a) Un histograma.
(b) Test de
χ2 .
(c) Test de Kolmogorov-Smirnov.
20. Se obtuvieron los siguientes resultados para el punto de ebullición, en grados Celsius de un compuesto de
silicio: 166, 141, 136, 153, 170, 162, 155, 146, 183, 157, 148, 132, 160, 175 y 150. Analiza si es razonable
suponer que provienen de una distribución normal mediante:
(a) Un histograma.
(b) Con papel probabilístico.
(c) Test de
χ2 .
(d) ¾Todos los test son aplicables?, ¾por qué?
21. En el archivo DIGIAZAR se encuentra la variable
digito
que contiene la respuesta dada por 131 estudiantes
cuando se les pidió que eligieran un dígito del 0 al 9 al azar.
(a) ¾Qué distribución dirías que deben seguir estos datos a priori ?
(b) Realiza un contraste que permita discutir la conjetura anterior.
(c) Estima la distribución de probabilidad de la variable aleatoria.
(d) ¾Hay dígitos igualmente probables?
22. En el archivo TENSIÓN se encuentran las resistencias a la tensión de 30 muestras de bra de poliéster
que, a priori, se consideraba que deberían corresponderse con una distribución uniforme.
(a) ¾Piensas que los datos conrman la conjetura inicial?
(b) ¾Conoces algún modelo de probabilidad que se ajuste mejor al comportamiento de la muestra?
5