Download X - PostData

Document related concepts

Distribución uniforme continua wikipedia , lookup

Distribución de probabilidad wikipedia , lookup

Función de densidad de probabilidad wikipedia , lookup

Variable aleatoria wikipedia , lookup

Distribución exponencial wikipedia , lookup

Transcript
Teorema Central del Límite.
Cálculo Numérico y Estadística. Grado en Química. U. de Alcalá. Curso 2014-2015.
F. San Segundo.
Motivación de las variables aleatorias continuas.
En las variables aleatorias discretas hemos usado una tabla de densidad para ver como se
reparte la probabilidad entre los distintos valores de la variable. Pero, como hemos visto en el
caso de la binomial, a medida que el número de valores aumenta y las diferencias entre ellos
empiezan a resultar irrelevantes, cobra cada vez más sentido la idea de reemplazar los
recángulos de la tabla por el área bajo la grá ca de una curva que describa la distribucion de
probabilidad.
2/14
Variables aleatorias continuas: la función de densidad.
Para que esa idea funcione necesitamos una función f con estas propiedades:
· No negativa: f(x)
≥ 0 para todo x; es decir, f no toma valores negativos.
· Probabilidad total igual a 1 : el área total bajo la grá ca de f es 1:
∞
∫
f(x)dx = 1
−∞
Dada una función f con esas propiedades, para calcular la probailidad de que la
variable aleatoria X de nida por f tome un valor en el intervalo (a, b) usamos
la integral:
b
P (a ≤ X ≤ b) = ∫
f(x)dx
a
Y decimos que f es la función de densidad de la variable aleatoria X
3/14
Interpretación de la función de densidad.
La función de densidad indica cómo se reparte la probabilidad total entre distintas zonas de
valores de la variable en el eje X . Cuanto más alta sea la función de densidad en un intervalo,
mayor probabilidad hay de que X tome un valor de ese intervalo.
4/14
Ejemplo 1: un caso típico.
√2
Dada la función f(x) =
, empezamos por ver su grá
4
π(1 + x )
ca (atención a las escalas de
los ejes):
f = function(x){sqrt(2) / (pi * (x^4 + 1))}
curve(f, from = -10, to = 10, col="red", lwd=3)
abline(h=0, lwd=3);abline(v=0, lwd=3) #ejes
GeoGebra es muy útil para explorar la grá ca de una función, porque permite hacer zoom y
desplazarse de forma muy sencilla.
5/14
Ejemplo 1: comprobación de la condición de integral total 1.
Vamos a empezar por usar varios programas para comprobar que se cumplen las condiciones
para usarla como función de densidad.
· en GeoGebra usaríamos: Integral[sqrt(2)/(pi * (x^4 + 1)), -∞, ∞] Usa la Vista
CAS para un resultado simbólico, o la Línea de entrada para un resultado numérico.
· En Wolfram Alpha sería integrate sqrt(2)/(pi * (x^4 + 1)) from -oo to oo.
Este programa devuelve ambos valores, simbólico y numérico.
· En R el cálculo numérico es:
integrate(f, -Inf, Inf)
## 1 with absolute error < 1.4e-05
Pero no hay una forma fácil de hacer cálculos simbólicos.
6/14
Ejemplo 1: cálculo de la probabilidad de un intervalo.
Una vez que sabemos que es una función de densidad, podemos empezar a usarla para
calcular probabilidades. Por ejemplo, la probabilidad P (0 < X < 1) se corresponde con el
área bajo la curva entre x
= 0 y x = 1 . Grá
1
Y se obtiene
P (0 < X < 1) = ∫
0
camente (las escalas no son iguales):
π + 2coth−1 (√2)
f(x)dx =
≈ 0.39027 ,
4π
como
puedes comprobar con cualquiera de los programas que hemos usado. En GeoGebra:
Integral[sqrt(2)/(pi * (x^4 + 1)), 0, 1]
7/14
Ejemplo 2: función de densidad con soporte en un intervalo acotado.
Nos referimos a los casos en los que la función de densidad es igual a 0 fuera de un intervalo
acotado. Por ejemplo:
f(x) = {
6 ⋅ (5x − 6 − x2 )
si 2 < x < 3,
0
en cualquier otro caso.
La grá ca de la función es:
En el Tutorial05 hay detalles de cómo dibujar estas grá cas.
8/14
Ejemplo 2: condición de integral total 1 y probabilidad de intervalos.
Puedes empezar comprobando que con esa de nición
∞
∫
3
f(x)dx = ∫
−∞
6 ⋅ (5x − 6 − x2 )dx = 1
2
En GeoGebra usaríamos
Integral[6 * (5 * x - 6 -x^2), 2, 3]
Y para calcular, por ejemplo, la probabilidad P (2.2
< X < 2.8) usaríamos:
Integral[6 * (5 * x - 6 -x^2), 2.2, 2.8]
Se obtiene, aproximadamente, 0.792. Para intervalos no completamente contenidos en (2, 3):
4
P (2.5 < X < 4) = ∫
3
f(x)dx = ∫
2.5
3
f(x)dx + ∫
2.5
3
f(x)dx = ∫
2.5
3
f(x)dx + 0 = ∫
2.5
f
2.5
y estamos en el caso anterior.
9/14
Función de distribución de una variable aleatoria continua.
La función de distribución F de la variable aleatoria continua X se de ne mediante:
k
F (k) = P (X ≤ k) = ∫
f(x)dx.
−∞
Esta ecuación muestra que
distribución). En general
F
F ′ (x) = f(x) (la f. de
densidad es la derivada de la función de
es una función creciente sigmoidea (con forma de S), de aspecto
parecido a esta grá ca:
10/14
Media y varianza de una variable aleatoria continua.
Las fórmulas que hemos visto en el caso discreto se pueden extender por analogía al caso
continuo, cambiando:
· sumas por integrales,
· el valor de P(X = x) por f(x)dx
Así se obtienen estas dos expresiones:
Si X es una variable aleatoria continua con función de densidad f(x), entonces
la media de X es el valor
∞
μ=∫
x ⋅ f(x)dx
−∞
mientras que la varianza de X es:
σ2 = ∫
∞
(x − μ)2 ⋅ f(x)dx.
−∞
11/14
Ejemplos.
Para calcular la media
μ de la variable X del Ejemplo 1 que hemos visto antes podemos usar
GeoGebra, con el comando
Integral[x * sqrt(2)/(pi * (x^4 + 1)), -∞, ∞]
y se obtiene μ = 0 , como nos debería haber hecho ver la intuición. La varianza no es tan
evidente, pero la calculamos con:
Integral[(x - 0)^2 * sqrt(2)/(pi * (x^4 + 1)), -∞, ∞]
y se obtiene σ 2
= 1. Para hallar la media μ de la X del Ejemplo 2 sería:
Integral[x * 6 * (5 * x - 6 -x^2), 2, 3]
y se obtiene μ
=
5
. La varianza se calcula con:
2
Integral[(x -5/2)^2 * 6 * (5 * x - 6 -x^2), 2, 3]
y se obtiene
1
.
20
12/14
Distribución uniforme.
La distribución uniforme es un tipo muy sencillo de variable aleatoria continua, diseñada para
que la probabilidad total se reparta de manera uniforme por un intervalo (a, b), de manera
que todos los subintervalos de (a, b) sean igual de probables.
Para conseguir esto su función de densidad tiene que ser constante en el intervalo
(a, b) e
igual a 0 fuera de ese intervalo. Como la probabilidad total tiene que ser 1 se obtiene:
⎧
⎪ 1
f(x) = ⎨ b − a
⎩
⎪
0
si a < x < b
en otro caso.
La media de la distribución uniforme en (a, b) es, como cabría esperar,
a+b
μ=
.
2
Dejamos como ejercicio el cálculo de su varianza.
La variable uniforme corresponde a la idea intuitiva (pero incorrecta) de que "todos los puntos
del intervalo (a, b) son igual de probables".
13/14
La aparente paradoja de las variables continuas.
¿Por qué hemos dicho que esa idea es incorrecta?
Porque si
X
es una variable aleatoria cualquiera (no hace falta que sea uniforme) la
probabilidad de un punto cualquiera x0 tiene que ser necesariamente 0 :
P (X = x0 ) = 0.
Para ver porque es esto, imagínate que la probabilidad de un punto fuera extremadamente
pequeña, del orden de millonésimas. Aún en ese caso, cualquier intervalo
(a, b)
contiene
in nitos puntos. Así que al sumar el valor de la probabilidad de esos puntos por separado se
obtendría siempre un valor mayor que 1 .
En las variables aleatorias continuas, conviene insistir en esto, son los intervalos los que
tienen probabilidad no nula, no los puntos. En la práctica, este carácter de las variables
continuas las hace mucho más adecuadas para describir los problemas del mundo real en los
que hay imprecisiones; en general, lo más a lo que podemos aspirar es a decir que el valor de
una cierta variable está contenido en un intervalo.
14/14