Download X - PostData
Document related concepts
Transcript
Teorema Central del Límite. Cálculo Numérico y Estadística. Grado en Química. U. de Alcalá. Curso 2014-2015. F. San Segundo. Motivación de las variables aleatorias continuas. En las variables aleatorias discretas hemos usado una tabla de densidad para ver como se reparte la probabilidad entre los distintos valores de la variable. Pero, como hemos visto en el caso de la binomial, a medida que el número de valores aumenta y las diferencias entre ellos empiezan a resultar irrelevantes, cobra cada vez más sentido la idea de reemplazar los recángulos de la tabla por el área bajo la grá ca de una curva que describa la distribucion de probabilidad. 2/14 Variables aleatorias continuas: la función de densidad. Para que esa idea funcione necesitamos una función f con estas propiedades: · No negativa: f(x) ≥ 0 para todo x; es decir, f no toma valores negativos. · Probabilidad total igual a 1 : el área total bajo la grá ca de f es 1: ∞ ∫ f(x)dx = 1 −∞ Dada una función f con esas propiedades, para calcular la probailidad de que la variable aleatoria X de nida por f tome un valor en el intervalo (a, b) usamos la integral: b P (a ≤ X ≤ b) = ∫ f(x)dx a Y decimos que f es la función de densidad de la variable aleatoria X 3/14 Interpretación de la función de densidad. La función de densidad indica cómo se reparte la probabilidad total entre distintas zonas de valores de la variable en el eje X . Cuanto más alta sea la función de densidad en un intervalo, mayor probabilidad hay de que X tome un valor de ese intervalo. 4/14 Ejemplo 1: un caso típico. √2 Dada la función f(x) = , empezamos por ver su grá 4 π(1 + x ) ca (atención a las escalas de los ejes): f = function(x){sqrt(2) / (pi * (x^4 + 1))} curve(f, from = -10, to = 10, col="red", lwd=3) abline(h=0, lwd=3);abline(v=0, lwd=3) #ejes GeoGebra es muy útil para explorar la grá ca de una función, porque permite hacer zoom y desplazarse de forma muy sencilla. 5/14 Ejemplo 1: comprobación de la condición de integral total 1. Vamos a empezar por usar varios programas para comprobar que se cumplen las condiciones para usarla como función de densidad. · en GeoGebra usaríamos: Integral[sqrt(2)/(pi * (x^4 + 1)), -∞, ∞] Usa la Vista CAS para un resultado simbólico, o la Línea de entrada para un resultado numérico. · En Wolfram Alpha sería integrate sqrt(2)/(pi * (x^4 + 1)) from -oo to oo. Este programa devuelve ambos valores, simbólico y numérico. · En R el cálculo numérico es: integrate(f, -Inf, Inf) ## 1 with absolute error < 1.4e-05 Pero no hay una forma fácil de hacer cálculos simbólicos. 6/14 Ejemplo 1: cálculo de la probabilidad de un intervalo. Una vez que sabemos que es una función de densidad, podemos empezar a usarla para calcular probabilidades. Por ejemplo, la probabilidad P (0 < X < 1) se corresponde con el área bajo la curva entre x = 0 y x = 1 . Grá 1 Y se obtiene P (0 < X < 1) = ∫ 0 camente (las escalas no son iguales): π + 2coth−1 (√2) f(x)dx = ≈ 0.39027 , 4π como puedes comprobar con cualquiera de los programas que hemos usado. En GeoGebra: Integral[sqrt(2)/(pi * (x^4 + 1)), 0, 1] 7/14 Ejemplo 2: función de densidad con soporte en un intervalo acotado. Nos referimos a los casos en los que la función de densidad es igual a 0 fuera de un intervalo acotado. Por ejemplo: f(x) = { 6 ⋅ (5x − 6 − x2 ) si 2 < x < 3, 0 en cualquier otro caso. La grá ca de la función es: En el Tutorial05 hay detalles de cómo dibujar estas grá cas. 8/14 Ejemplo 2: condición de integral total 1 y probabilidad de intervalos. Puedes empezar comprobando que con esa de nición ∞ ∫ 3 f(x)dx = ∫ −∞ 6 ⋅ (5x − 6 − x2 )dx = 1 2 En GeoGebra usaríamos Integral[6 * (5 * x - 6 -x^2), 2, 3] Y para calcular, por ejemplo, la probabilidad P (2.2 < X < 2.8) usaríamos: Integral[6 * (5 * x - 6 -x^2), 2.2, 2.8] Se obtiene, aproximadamente, 0.792. Para intervalos no completamente contenidos en (2, 3): 4 P (2.5 < X < 4) = ∫ 3 f(x)dx = ∫ 2.5 3 f(x)dx + ∫ 2.5 3 f(x)dx = ∫ 2.5 3 f(x)dx + 0 = ∫ 2.5 f 2.5 y estamos en el caso anterior. 9/14 Función de distribución de una variable aleatoria continua. La función de distribución F de la variable aleatoria continua X se de ne mediante: k F (k) = P (X ≤ k) = ∫ f(x)dx. −∞ Esta ecuación muestra que distribución). En general F F ′ (x) = f(x) (la f. de densidad es la derivada de la función de es una función creciente sigmoidea (con forma de S), de aspecto parecido a esta grá ca: 10/14 Media y varianza de una variable aleatoria continua. Las fórmulas que hemos visto en el caso discreto se pueden extender por analogía al caso continuo, cambiando: · sumas por integrales, · el valor de P(X = x) por f(x)dx Así se obtienen estas dos expresiones: Si X es una variable aleatoria continua con función de densidad f(x), entonces la media de X es el valor ∞ μ=∫ x ⋅ f(x)dx −∞ mientras que la varianza de X es: σ2 = ∫ ∞ (x − μ)2 ⋅ f(x)dx. −∞ 11/14 Ejemplos. Para calcular la media μ de la variable X del Ejemplo 1 que hemos visto antes podemos usar GeoGebra, con el comando Integral[x * sqrt(2)/(pi * (x^4 + 1)), -∞, ∞] y se obtiene μ = 0 , como nos debería haber hecho ver la intuición. La varianza no es tan evidente, pero la calculamos con: Integral[(x - 0)^2 * sqrt(2)/(pi * (x^4 + 1)), -∞, ∞] y se obtiene σ 2 = 1. Para hallar la media μ de la X del Ejemplo 2 sería: Integral[x * 6 * (5 * x - 6 -x^2), 2, 3] y se obtiene μ = 5 . La varianza se calcula con: 2 Integral[(x -5/2)^2 * 6 * (5 * x - 6 -x^2), 2, 3] y se obtiene 1 . 20 12/14 Distribución uniforme. La distribución uniforme es un tipo muy sencillo de variable aleatoria continua, diseñada para que la probabilidad total se reparta de manera uniforme por un intervalo (a, b), de manera que todos los subintervalos de (a, b) sean igual de probables. Para conseguir esto su función de densidad tiene que ser constante en el intervalo (a, b) e igual a 0 fuera de ese intervalo. Como la probabilidad total tiene que ser 1 se obtiene: ⎧ ⎪ 1 f(x) = ⎨ b − a ⎩ ⎪ 0 si a < x < b en otro caso. La media de la distribución uniforme en (a, b) es, como cabría esperar, a+b μ= . 2 Dejamos como ejercicio el cálculo de su varianza. La variable uniforme corresponde a la idea intuitiva (pero incorrecta) de que "todos los puntos del intervalo (a, b) son igual de probables". 13/14 La aparente paradoja de las variables continuas. ¿Por qué hemos dicho que esa idea es incorrecta? Porque si X es una variable aleatoria cualquiera (no hace falta que sea uniforme) la probabilidad de un punto cualquiera x0 tiene que ser necesariamente 0 : P (X = x0 ) = 0. Para ver porque es esto, imagínate que la probabilidad de un punto fuera extremadamente pequeña, del orden de millonésimas. Aún en ese caso, cualquier intervalo (a, b) contiene in nitos puntos. Así que al sumar el valor de la probabilidad de esos puntos por separado se obtendría siempre un valor mayor que 1 . En las variables aleatorias continuas, conviene insistir en esto, son los intervalos los que tienen probabilidad no nula, no los puntos. En la práctica, este carácter de las variables continuas las hace mucho más adecuadas para describir los problemas del mundo real en los que hay imprecisiones; en general, lo más a lo que podemos aspirar es a decir que el valor de una cierta variable está contenido en un intervalo. 14/14