Download PostData

Document related concepts
no text concepts found
Transcript
Teorema Central del Límite.
Cálculo Numérico y Estadística. Grado en Química. U. de Alcalá. Curso 2014-2015.
F. San Segundo.
Variables de Bernouilli.
Una de las familias de variables aleatorias más básicas son las variables de Bernouilli. Una
variable X de tipo Ber(p) sólo toma dos valores: el 1, llamado arbitrariamente éxito y el 0,
llamado fracaso.
La tabla de densidad de una variable X
∼ Ber(p) (el símbolo ∼ signi
ca "de tipo") es:
VALOR
1
0
Probabilidad
p
q
donde las probabilidades de éxito p y de fracaso q tienen que cumplir necesariamente
p + q = 1.
Las variables de tipo Ber(p) son útiles como modelos teóricos de ese tipo tan común de
situaciones en las que el experimento tiene sólo dos resultados posibles, pero con distintas
probabilidades. Los valores "1"" y "0" representan respuestas a preguntas de tipo "Sí / No". Por
ejemplo, una moneda no trucada corresponde a una variable Ber(1/2).
2/14
Media y varianza de las variables de tipo Bernouilli.
Aplicando la de nición de media, si X
∼ Ber(p) entonces:
μ = 1 ⋅ p + 0 ⋅ q = p.
De la misma forma, para la varianza se tiene:
σ 2 = (1 − p)2 ⋅ p + (0 − p)2 ⋅ q = q 2 ⋅ p + p2 ⋅ q = p ⋅ q
Las Variables de Bernouilli como piezas básicas de construcción.
Ya hemos visto anteriormente que a menudo se usa la técnica de estudiar las variables
aleatorias compuestas de otras variables más sencillas. Esa es una de las razones que hacen
importantes a las variables de Bernouilli. Al combinar, sumándolas, unas cuantes variables de
Bernouilli, se obtiene la familia más importante de variables aleatorias discretas: las binomiales
que vamos a estudiar con detalle.
3/14
Variable Binomial B(n, p).
p, si es la suma
independientes, todas de tipo Ber(p). En ese caso escribimos X = B(n, p) .
Una variable
X
es de tipo binomial, con parámetros
n
y
de
n
variables
X ∼ B(n, p) significa X = X1 + ⋯ + Xn , con X1 , … , Xn ∼ Ber(p) independientes.
De forma equivalente:
Una variable binomial X ∼ B(n, p) representa el número total de éxitos que
se obtiene en n repeticiones independientes de un experimento básico en el
que sólo hay dos resultados posibles, que llamamos arbitrariamente éxito y
fracaso, con probabilidades respectivas p y q = 1 − p.
Por ejemplo, al lanzar un dado decimos que éxito es sacar un
1,
de manera que
p=
1
. Si
6
lanzamos el dado 15 veces y nos preguntamos por el número de veces que se obtiene un 1 en
esas
n =15
tiradas, estamos pensando en la variable binomial
X ∼ B(15, 16 ) .
En otro
ejemplo, en un segundo concreto, cada uno de los átomos que forman los aproximadamente
0.0169 g de Potasio 40 que contiene el cuerpo humano puede desintegrarse (éxito) o no.
Sabiendo la probabilidad p de desintegración de cada uno de ellos por segundo ¿podemos
calcular la actividad radiactiva del potasio en nuestro cuerpo (en becquerelios)?
4/14
Tabla (función) de densidad de probabilidad de una variable Binomial
B(n, p).
n repeticiones del experimento, el número total de éxitos
tiene que ser un valor entre 0 y n . Llamemos k a ese valor. Entonces usando Combinatoria
(ver la Sección 5.1.2 del libro) se obtiene esta espresión para la probabilidad de que X tome el
valor k (probabilidad de k éxitos en n repeticiones):
Puesto que hacemos una serie de
n
P (X = k) = ( ) ⋅ pk ⋅ q n−k
k
Recuerda que
( nk ) es un número combinatorio. Por ejemplo, para X ∼ B(4,
2
) se obtiene
7
esta tabla de densidad:
VALOR
k
Probabilidad
0
1
2
3
4
0.2603082
0.4164931
0.2498959
0.0666389
0.0066639
donde, por ejemplo, si k
= 3:
3
4
4
2
5
P (X = 3) = ( ) ⋅ ( ) ⋅ ( ) ≈ 0.0666389
3
7
7
5/14
Media y desviación típica de una variable Binomial B(n, p).
Si
X ∼ B(n, p)
es una binomial, usando su descomposición como suma de variables de
Bernouilli es fácil obtener:
μX = n ⋅ p.
De la misma forma, pero usando además la independencia se obtiene este resultado para la
varianza:
2 = n ⋅ p ⋅ q,
σX
Ejemplo: para la variable X
∼ B(4,
y por tanto
σX = √−
n−⋅−p−−
⋅−
q.
2
) que hemos visto antes es:
7
2
8
μX = 4 ⋅ = ,
7
7
2
σX
2 5
40
=4⋅ ⋅ =
.
7 7
49
6/14
La Binomial B(n, p) en R.
En R disponemos de varias funciones para trabajar con distribuciones binomiales. Las tres que
más vamos a usar son: dbinom pbinom qbinom rbinom. Veámoslas por orden:
La función dbinom
Sirve para calcular la función de densidad de una variable binomial. Por ejemplo, si
2
X ∼ B(4, ), para calcular P (X = 3) hacemos
7
dbinom(3, size = 4, prob = 2/7)
## [1] 0.0666389
Para calcular la tabla de densidad completa haríamos:
dbinom(0:3, size = 4, prob = 2/7)
## [1] 0.2603082 0.4164931 0.2498959 0.0666389
7/14
La función pbinom.
Esta función sirve para calcular la función de distribución de una variable binomial. Si
X ∼ B(20,
8
), para calcular F (5) = P (X ≤ 5) en R usamos:
35
pbinom(5, size = 20, prob = 8/35)
## [1] 0.7019617
La función rbinom.
Esta función sirve para generar valores aleatorios que se distribuyen según las probabilidades
de la distribución binomial. Por ejemplo, para generar 20 valores aleatorios de una variable
X ∼ B(4, 1/3)
rbinom(20, size = 4, prob = 1/3)
##
[1] 0 2 1 0 0 1 1 0 2 1 2 1 0 1 2 2 1 0 2 1
Fíjate en que, por ejemplo, en esta colección particular de valores no aparece el
4
ni el
3,
aunque son valores posibles de X .
8/14
Grá co de una distribución binomial típica.
La distribución de probabilidad correspondiente a la binomial B(10, 1/3) es:
Las binomiales con n pequeño ( n < 30 ) y p moderado (ni muy cerca de 0 ni muy cerca de 1 )
tienen un aspecto similar a este, más o menos asimétricas según sea el valor de p . Hay otros
dos casos interesantes.
9/14
Un caso más difícil: n grande pero p pequeño.
n (por ejemplo n = 500 ) pero con p
(n ⋅ p > 5 ) entonces su grá ca tiene un
Si tenemos una distribución con un valor grande de
pequeño (por ejemplo
p = 0.01 ),
de forma que
aspecto similar a este, o más exageradamente asimétrico aún:
Este es un caso especial, pero que se presenta con mucha frecuencia en algunos procesos
naturales (los "sucesos raros"). La técnica más usada para este tipo de situaciones es aproximar
la Binomial por una Distribución de Poisson, que se describen en el Capítulo 8 del libro.
10/14
Y un caso muy importante: n grande y p no demasiado pequeño.
Por sus consecuencias este es el caso que más nos interesa. La grá ca de una binomial como
B(80, 1/4) es así:
· El per l de esta distribución tiene forma de curva con forma de campana.
· Cuando
n
se hace más grande (cientos o miles), la diferencia entre valores cercanos de la
binomial se hace irrelevante. Lo importante entonces es el intervalo al que pertenece el
valor de la variable. Es un paso de lo discreto a lo continuo.
11/14
La curva normal.
¿Cuál es esa curva con forma de campana? De Moivre fue capaz de resolver el problema. Si
tenemos una binomial B(n, p) con n grande (n > 30 ) y p moderado, de manera que
μ = n ⋅ p , σ = √−
n−⋅−p−−
⋅−
q , entonces
la curva que aproxima a la binomial es la grá ca de la
función normal:
x−μ
1
− 12 ( σ )
fμ,σ (x) =
−− e
σ√2π
2
En realidad se trata de una familia de curvas, que cambian con los valores de μ y σ:
·
μ indica la posición del máximo de la campana.
·
σ controla la anchura de la campana.
En el Tutorial05 hay herramientas para explorar esta familia de curvas (usando por ejemplo
GeoGebra).
12/14
Un ejemplo.
Por ejemplo, para la binomial
B(80, 1/4)
la curva normal superpuesta a la distribución es
esta:
13/14
Usando la curva para calcular la probabilidad.
Si en una binomial como
P (X = k),
X ∼ B(80, 1/4)
calculamos la probabilidad de un valor individiual,
obtenemos normalmente valores extremadamente pequeños. Lo relevante en
este caso son las preguntas sobre intervalos, como
P (20 ≤ X ≤ 25).
En el grá co esto
corresponde con el área sombreada:
Y esa probabilidad se corresponde aproximadamente con el área bajo la curva entre
x = 25 .
A medida que
n
x = 20 y
aumenta, usar la binomial se hace mucho más difícil que usar la
curva. Para calcular ese área necesitaremos integrales.
14/14