Download Grado en Ciencias Ambientales - Estadística

Document related concepts

Distribución de Poisson wikipedia , lookup

Distribución exponencial wikipedia , lookup

Distribución de Cauchy wikipedia , lookup

Análisis de frecuencia acumulada wikipedia , lookup

Estadístico muestral wikipedia , lookup

Transcript
Grado en Ciencias Ambientales - Estadística
Práctica 2a (Variables Aleatorias)
El número de huevos que pone una hembra de gorrión molinero (passer montanus) a lo
largo de su vida sigue una distribución binomial de parámetros n=15 y p=0.16.
Puesto que necesitamos trabajar con una distribución binomial B(15,0.16), y no con una
muestra de datos, al arrancar Statgraphics aparecerá la siguiente pantalla:
Debemos indicar que se desea “Realizar un Análisis que no Requiere Datos…” A continuación,
seleccionar “Examinar una Distribución de Probabilidad”:
Del menú que aparece a continuación, elegimos “Binomial”:
Por defecto, SG trabaja con una binomial B(10, 0.1) (es decir, n=10, p=0.1) Lo que SG llama
“probabilidad de evento”, es p, y lo que llama “número de ensayos”, n. Podemos cambiar esos
valores con botón derecho + opciones de análisis. En nuestro caso, fijamos una probabilidad de
evento de 0,16 (ojo, para los decimales debemos emplear una coma, no un punto) y un nº de
ensayos de 15.
1. Calcula la probabilidad de que un individuo concreto ponga exactamente 3
huevos.
Si llamamos X = “número de huevos puestos por la hembra”, que según el
enunciado es B(15, 0.16), entonces nos están pidiendo P(X=3). Eso es lo que SG
llama “probabilidad de masa”:
Por defecto, SG proporciona P(X=0). Si lo que queremos es P(X=3), entonces botón
derecho + opciones de ventana, y en “valores para la variable” introducimos 3. La
probabilidad pedida es de 0.229997; en porcentaje, un 23% aprox.
Distribución Acumulativa
-----------------------Distribución: Binomial
Variable
3
Area de cola inferior (<)
Dist. 1
Dist. 2
0,560785
Dist. 3
Dist. 4
Dist. 5
Variable
3
Probabilidad de Masa (=)
Dist. 1
Dist. 2
0,229997
Dist. 3
Dist. 4
Dist. 5
Variable
3
Area de cola Superior (>)
Dist. 1
Dist. 2
0,209218
Dist. 3
Dist. 4
Dist. 5
2. Calcula la probabilidad de que ponga 4 huevos ó menos.
Nos están pidiendo P(X ≤ 4) = P(X < 4) + P(X=4). Para ello, botón derecho +
opciones de ventana, e introducimos en “valores para la variable” el valor 4. Ahora
aparece:
Distribución: Binomial
Variable
4
Area de cola inferior (<)
Dist. 1
Dist. 2
0,790782
Dist. 3
Dist. 4
Dist. 5
Variable
4
Probabilidad de Masa (=)
Dist. 1
Dist. 2
0,131427
Dist. 3
Dist. 4
Dist. 5
Variable
4
Area de cola Superior (>)
Dist. 1
Dist. 2
0,077791
Dist. 3
Dist. 4
Dist. 5
Arriba, donde dice “Área de cola inferior”, está P(X<4)=0.790782. En
“Probabilidad de masa” aparece P(X=4) = 0.131427. Por lo tanto, basta con sumar
ambas probabilidades (se puede hacer, por ejemplo, con la calculadora que lleva
incorporada SG), casi debajo de la “Ayuda”. El resultado final es 0.922209, o si se
prefiere una probabilidad del 92.2209%.
3. ¿A partir de qué valor está el 25% de los gorriones que menos huevos llegan a
poner?
En este caso se nos está pidiendo el valor “a” tal que P(X≤ a)=0.25. Obsérvese que
se trata, de algún modo, del problema “inverso” al apartado anterior. Para resolver
esta cuestión, botón amarillo (también llamado botón de opciones tabulares) + CDF
inverso.
En la pantalla aparecen, en CDF, los valores de distintas probabilidades, y en la
columna llamada “Dist. 1”, los valores “a” correspondientes. Por ejemplo, se tiene
que P(X≤0)=0.01, o que P(X≤1)=0.1. Lo que nosotros querríamos es que en la
columna CDF apareciera el valor 0.25: en ese caso, el valor que apareciera en la
columna Dist. 1, sería el valor “a” que estamos buscando. Para ello, botón derecho +
Opciones de ventana, e introducimos, en CDF, el valor 0,25. El valor que aparece,
entonces, es 1. Por lo tanto, el 25% de gorriones que pone menos huevos, pone 1
huevo, o ninguno.
4. Genera 100 números aleatorios según la distribución indicada (esta podría ser
una muestra real de gorriones). Compara la distribución de frecuencias obtenida
con la distribución de probabilidad que la ha originado. Sobre la muestra
generada, ¿qué porcentaje de los gorriones han puesto 3 huevos?
Activamos el botón “Guardar resultados”. Después, hacemos clic en la casilla
“Números aleatorios para la distribución Dist1” y le damos el nombre que queramos
a la Variable Destino. Lo que va a hacer SG es simular la extracción de una muestra
de tamaño 100 de una población que siga exactamente una binomial como la que
estamos considerando. Puesto que estamos tomando una muestra, lo que
obtendremos no se corresponderá exactamente con la binomial, pero sí tendrá un
comportamiento similar. Tras aceptar, veremos que en la hoja de datos se han
generado 100 valores de una nueva variable (nosotros la hemos llamado ALEAT1).
Sobre la muestra generada, ¿qué porcentaje de los gorriones han puesto 3 huevos?
Para responder a la pregunta, por ejemplo acudimos a Descripción + Datos
cualitativos + Tabulación (no es que la variable sea cualitativa, simplemente esta
ruta es apropiada). Ahí vemos que la frecuencia relativa del valor 3 es 0.20, y en
consecuencia, que un 20% de los gorriones de la muestra han puesto 3 huevos
(IMPORTANTE: los datos que SG genera son aleatorios; por lo tanto, lo esperable
es que a vosotros os queden otros datos, y otros resultados, aunque probablemente
las cantidades serán parecidas). Observermos que en la pregunta 1 obtuvimos, para
la población, una probabilidad de 23%; por lo tanto, hay obvias similitudes entre lo
que se da en la población, y lo que aparece en la muestra.
5. ¿Cuál es el primer cuartil?
La pregunta se refiere a la variable que hemos generado de forma aleatoria a partir
de la distribución binomial. En consecuencia, Descripción + Datos Numéricos +
Análisis Unidimensional; en Datos escribimos ALEAT1. El primer cuartil, en
nuestro caso, es 1, que coincide con el ejercicio 3 (que respondía a esta pregunta,
pero sobre la población).
6. Compara la media calculada sobre la binomial con la obtenida sobre la muestra.
La media de nuestra muestra es 2.28 (la vuestra será probablemente diferente). La
media de la población es n*p=15*0.16=2.4. De nuevo están cerca.
7. Haz lo mismo que en el apartado 4 pero sólo con 25 números.
Con el botón “Guardar resultados” no podemos controlar el tamaño de la muestra
aleatoria. Así que en este caso volvemos a la ventana de la distribución binomial, y
activamos botón amarillo + números aleatorios. Ahí podemos cambiar el tamaño de
la muestra. Después, procedemos como antes.
El tiempo de vida de los gorriones sigue una distribución exponencial de media 3 años.
8. Calcula la probabilidad de que un gorrión viva más de 3 años.
Vamos a Descripción + Distribuciones + Distribuciones de probabilidad, y elegimos
“Exponencial” (en la columna de la izquierda, abajo del todo). Por defecto, SG trabaja
con una exponencial de media 10; para cambiar la media, botón derecho + opciones de
análisis, y la cambiamos a 3. Nos están pidiendo P(X>3). Como por defecto aparecen
cálculos relativos al valor 0, botón derecho + opciones de ventana, y en valores para la
variable introducimos 3. En este caso, la probabilidad que nos piden aparece en lo que
SG llama “Área de cola superior”, y su valor es de 0.367879. La probabilidad P(X<3)
aparece en “Área de cola superior”. Lo que SG llama “Densidad de probabilidad” es el
valor de la función de densidad para x=3, y NO TIENE NINGUN SIGNIFICADO EN
TÉRMINOS DE PROBABILIDAD.
Distribución Acumulativa
-----------------------Distribución: Exponencial
Variable
3
Area de cola inferior (<)
Dist. 1
Dist. 2
0,632121
Dist. 3
Dist. 4
Dist. 5
Variable
3
Densidad de Probabilidad
Dist. 1
Dist. 2
0,122626
Dist. 3
Dist. 4
Dist. 5
Variable
3
Area de cola Superior (>)
Dist. 1
Dist. 2
0,367879
Dist. 3
Dist. 4
Dist. 5
Por lo tanto, la prob. Pedida es del 36.79%
9. ¿A partir de qué tiempo de vida está el 10% de los gorriones más longevos?
Nos preguntan el valor “a” tal que P(X>a)=0,10. En consecuencia, botón amarillo de
opciones tabulares + CDF inverso.
Inversa CDF
----------Distribución: Exponencial
CDF
0,01
0,1
0,5
0,9
0,99
Dist. 1
0,030151
0,316082
2,07944
6,90776
13,8155
Dist. 2
Dist. 3
Dist. 4
Dist. 5
El valor pedido es 6.9 (es decir, unos 7 años).
10. Genera aleatoriamente una muestra de 100 tiempos de vida según la distribución
especificada y compara el histograma obtenido sobre la muestra con la función
de densidad de la exponencial.
Botón Guardar resultados + activar la casilla de “Guardar números aleatorios para Dist.
1” + dar nombre a la variable (en nuestro caso, el nombre es ALEAT2). Puesto que los
números son aleatorios, los resultados serán diferentes en cada caso. Para visualizar el
histograma de la muestra aleatoria generada, Descripción + Datos Numéricos + Análisis
Unidimensional + Datos = ALEAT2. Después, botón de opciones gráficas +
histograma. En nuestro caso, el histograma obtenido es:
Histograma
frecuencia
50
40
30
20
10
0
-1
3
7
11
15
19
23
ALEAT2
Nótese que el histograma recuerda la forma de la función de densidad de la exponencial
(asimetría a la derecha muy acusada, con los datos concentrados a la izquierda del
histograma)
11. Comprueba qué porcentaje de la muestra llega a superar los 3 años de edad.
Calcula el decil 9 y compáralo con el punto crítico obtenido en el apartado 9.
Compara la media y varianza de la distribución exponencial con las obtenidas
sobre la muestra. ¿Qué coeficiente de asimetría presentan los datos generados?
El porcentaje se obtiene con botón amarillo+ Tabla de frecuencias+botón
derecho+opciones de ventana+límite superior=3.
El decil 9 (percentil 90) de la muestra se calcula con botón amarillo + percentiles. En
nuestro caso es de 7.55, mientras que en el apartado 9 se proporcionaba un valor
próximo a 7.
Resumen Estadístico para ALEAT2
Frecuencia = 100
Media = 3,26595
Mediana = 2,34497
Moda =
Varianza = 9,26614
Desviación típica = 3,04403
Mínimo = 0,0336664
Máximo = 18,202
Rango = 18,1683
Primer cuartil = 1,01572
Segundo cuartil = 4,73506
Rango intercuar. = 3,71934
Asimetría = 1,75987
Asimetría tipi. = 7,18466
Curtosis = 4,79433
Curtosis típificada = 9,78638
Coef. de variación = 93,205%
La media muestral es 3.26, similar al valor de la media de la exponencial (3); la
varianza muestral es 9.27, similar a la varianza poblacional (9; nótese que la desviación
típica y la media de una distribución exponencial son iguales, y en consecuencia la
varianza es la media al cuadrado). El coeficiente de asimetría es de 1.76, y el de
asimetría tipificado es de 7.18, revelando una asimetría a la derecha muy acusada (en
particular, no aceptable para una distribución normal, por ejemplo).
12. Si tenemos 10 gorriones, ¿qué probabilidad hay de que exactamente 4 de ellos
vivan más de 3 años?
Para contestar a esto, tendríamos que calcular, en una binomial B(10,0.367879) (nótese
que el valor p=0.367879 corresponde a la probabilidad calculada en el ejercicio 8), la
probabilidad P(X=4). El valor pedido es 0.245381.