Download PostData
Document related concepts
no text concepts found
Transcript
Teorema Central del Límite. Cálculo Numérico y Estadística. Grado en Química. U. de Alcalá. Curso 2014-2015. F. San Segundo. Variables de Bernouilli. Una de las familias de variables aleatorias más básicas son las variables de Bernouilli. Una variable X de tipo Ber(p) sólo toma dos valores: el 1, llamado arbitrariamente éxito y el 0, llamado fracaso. La tabla de densidad de una variable X ∼ Ber(p) (el símbolo ∼ signi ca "de tipo") es: VALOR 1 0 Probabilidad p q donde las probabilidades de éxito p y de fracaso q tienen que cumplir necesariamente p + q = 1. Las variables de tipo Ber(p) son útiles como modelos teóricos de ese tipo tan común de situaciones en las que el experimento tiene sólo dos resultados posibles, pero con distintas probabilidades. Los valores "1"" y "0" representan respuestas a preguntas de tipo "Sí / No". Por ejemplo, una moneda no trucada corresponde a una variable Ber(1/2). 2/14 Media y varianza de las variables de tipo Bernouilli. Aplicando la de nición de media, si X ∼ Ber(p) entonces: μ = 1 ⋅ p + 0 ⋅ q = p. De la misma forma, para la varianza se tiene: σ 2 = (1 − p)2 ⋅ p + (0 − p)2 ⋅ q = q 2 ⋅ p + p2 ⋅ q = p ⋅ q Las Variables de Bernouilli como piezas básicas de construcción. Ya hemos visto anteriormente que a menudo se usa la técnica de estudiar las variables aleatorias compuestas de otras variables más sencillas. Esa es una de las razones que hacen importantes a las variables de Bernouilli. Al combinar, sumándolas, unas cuantes variables de Bernouilli, se obtiene la familia más importante de variables aleatorias discretas: las binomiales que vamos a estudiar con detalle. 3/14 Variable Binomial B(n, p). p, si es la suma independientes, todas de tipo Ber(p). En ese caso escribimos X = B(n, p) . Una variable X es de tipo binomial, con parámetros n y de n variables X ∼ B(n, p) significa X = X1 + ⋯ + Xn , con X1 , … , Xn ∼ Ber(p) independientes. De forma equivalente: Una variable binomial X ∼ B(n, p) representa el número total de éxitos que se obtiene en n repeticiones independientes de un experimento básico en el que sólo hay dos resultados posibles, que llamamos arbitrariamente éxito y fracaso, con probabilidades respectivas p y q = 1 − p. Por ejemplo, al lanzar un dado decimos que éxito es sacar un 1, de manera que p= 1 . Si 6 lanzamos el dado 15 veces y nos preguntamos por el número de veces que se obtiene un 1 en esas n =15 tiradas, estamos pensando en la variable binomial X ∼ B(15, 16 ) . En otro ejemplo, en un segundo concreto, cada uno de los átomos que forman los aproximadamente 0.0169 g de Potasio 40 que contiene el cuerpo humano puede desintegrarse (éxito) o no. Sabiendo la probabilidad p de desintegración de cada uno de ellos por segundo ¿podemos calcular la actividad radiactiva del potasio en nuestro cuerpo (en becquerelios)? 4/14 Tabla (función) de densidad de probabilidad de una variable Binomial B(n, p). n repeticiones del experimento, el número total de éxitos tiene que ser un valor entre 0 y n . Llamemos k a ese valor. Entonces usando Combinatoria (ver la Sección 5.1.2 del libro) se obtiene esta espresión para la probabilidad de que X tome el valor k (probabilidad de k éxitos en n repeticiones): Puesto que hacemos una serie de n P (X = k) = ( ) ⋅ pk ⋅ q n−k k Recuerda que ( nk ) es un número combinatorio. Por ejemplo, para X ∼ B(4, 2 ) se obtiene 7 esta tabla de densidad: VALOR k Probabilidad 0 1 2 3 4 0.2603082 0.4164931 0.2498959 0.0666389 0.0066639 donde, por ejemplo, si k = 3: 3 4 4 2 5 P (X = 3) = ( ) ⋅ ( ) ⋅ ( ) ≈ 0.0666389 3 7 7 5/14 Media y desviación típica de una variable Binomial B(n, p). Si X ∼ B(n, p) es una binomial, usando su descomposición como suma de variables de Bernouilli es fácil obtener: μX = n ⋅ p. De la misma forma, pero usando además la independencia se obtiene este resultado para la varianza: 2 = n ⋅ p ⋅ q, σX Ejemplo: para la variable X ∼ B(4, y por tanto σX = √− n−⋅−p−− ⋅− q. 2 ) que hemos visto antes es: 7 2 8 μX = 4 ⋅ = , 7 7 2 σX 2 5 40 =4⋅ ⋅ = . 7 7 49 6/14 La Binomial B(n, p) en R. En R disponemos de varias funciones para trabajar con distribuciones binomiales. Las tres que más vamos a usar son: dbinom pbinom qbinom rbinom. Veámoslas por orden: La función dbinom Sirve para calcular la función de densidad de una variable binomial. Por ejemplo, si 2 X ∼ B(4, ), para calcular P (X = 3) hacemos 7 dbinom(3, size = 4, prob = 2/7) ## [1] 0.0666389 Para calcular la tabla de densidad completa haríamos: dbinom(0:3, size = 4, prob = 2/7) ## [1] 0.2603082 0.4164931 0.2498959 0.0666389 7/14 La función pbinom. Esta función sirve para calcular la función de distribución de una variable binomial. Si X ∼ B(20, 8 ), para calcular F (5) = P (X ≤ 5) en R usamos: 35 pbinom(5, size = 20, prob = 8/35) ## [1] 0.7019617 La función rbinom. Esta función sirve para generar valores aleatorios que se distribuyen según las probabilidades de la distribución binomial. Por ejemplo, para generar 20 valores aleatorios de una variable X ∼ B(4, 1/3) rbinom(20, size = 4, prob = 1/3) ## [1] 0 2 1 0 0 1 1 0 2 1 2 1 0 1 2 2 1 0 2 1 Fíjate en que, por ejemplo, en esta colección particular de valores no aparece el 4 ni el 3, aunque son valores posibles de X . 8/14 Grá co de una distribución binomial típica. La distribución de probabilidad correspondiente a la binomial B(10, 1/3) es: Las binomiales con n pequeño ( n < 30 ) y p moderado (ni muy cerca de 0 ni muy cerca de 1 ) tienen un aspecto similar a este, más o menos asimétricas según sea el valor de p . Hay otros dos casos interesantes. 9/14 Un caso más difícil: n grande pero p pequeño. n (por ejemplo n = 500 ) pero con p (n ⋅ p > 5 ) entonces su grá ca tiene un Si tenemos una distribución con un valor grande de pequeño (por ejemplo p = 0.01 ), de forma que aspecto similar a este, o más exageradamente asimétrico aún: Este es un caso especial, pero que se presenta con mucha frecuencia en algunos procesos naturales (los "sucesos raros"). La técnica más usada para este tipo de situaciones es aproximar la Binomial por una Distribución de Poisson, que se describen en el Capítulo 8 del libro. 10/14 Y un caso muy importante: n grande y p no demasiado pequeño. Por sus consecuencias este es el caso que más nos interesa. La grá ca de una binomial como B(80, 1/4) es así: · El per l de esta distribución tiene forma de curva con forma de campana. · Cuando n se hace más grande (cientos o miles), la diferencia entre valores cercanos de la binomial se hace irrelevante. Lo importante entonces es el intervalo al que pertenece el valor de la variable. Es un paso de lo discreto a lo continuo. 11/14 La curva normal. ¿Cuál es esa curva con forma de campana? De Moivre fue capaz de resolver el problema. Si tenemos una binomial B(n, p) con n grande (n > 30 ) y p moderado, de manera que μ = n ⋅ p , σ = √− n−⋅−p−− ⋅− q , entonces la curva que aproxima a la binomial es la grá ca de la función normal: x−μ 1 − 12 ( σ ) fμ,σ (x) = −− e σ√2π 2 En realidad se trata de una familia de curvas, que cambian con los valores de μ y σ: · μ indica la posición del máximo de la campana. · σ controla la anchura de la campana. En el Tutorial05 hay herramientas para explorar esta familia de curvas (usando por ejemplo GeoGebra). 12/14 Un ejemplo. Por ejemplo, para la binomial B(80, 1/4) la curva normal superpuesta a la distribución es esta: 13/14 Usando la curva para calcular la probabilidad. Si en una binomial como P (X = k), X ∼ B(80, 1/4) calculamos la probabilidad de un valor individiual, obtenemos normalmente valores extremadamente pequeños. Lo relevante en este caso son las preguntas sobre intervalos, como P (20 ≤ X ≤ 25). En el grá co esto corresponde con el área sombreada: Y esa probabilidad se corresponde aproximadamente con el área bajo la curva entre x = 25 . A medida que n x = 20 y aumenta, usar la binomial se hace mucho más difícil que usar la curva. Para calcular ese área necesitaremos integrales. 14/14