Download Capítulo 4 Modelos de probabilidad

Document related concepts
no text concepts found
Transcript
Capítulo 4
Modelos de probabilidad
4.1
4.1.1
Modelos discretos
Pruebas de Bernoulli
Definición 4.1.1. Una prueba de Bernoulli es un experimento aleatorio cuyos posibles resultados se agrupan en dos conjuntos excluyentes que llamaremos éxito (E) y fracaso (F ), con
respectivas probabilidades: p = P (E) y 1 − p = P (F ).
Ejemplos 31 En el lanzamiento de una moneda podemos tomar E = { Cara } y F = { Cruz }.
Si la moneda no está trucada, p = 21 .
En una población se elige al azar una persona y consideramos los sucesos E = { altura ≥ 1.80}
y F = { altura < 1.80}. La probabilidad de éxito dependerá de la distribución de la variable altura
en la población.
En el lanzamiento de un dado podemos tomar E = {6} y F = {1, 2, 3, 4, 5}. Si el dado es
perfecto, p = 61 ; si está trucado y, por ejemplo, el 2 tiene probabilidad doble que cualquiera de los
demás resultados, p = 17 .
La distribución de Bernoulli es el modelo más sencillo obtenido a partir de pruebas de Bernoulli.
Definición 4.1.2. Realizada una prueba de Bernoulli con P (E) = p se considera la variable aleatoria
½
X=
1 si obtenemos éxito
0 si obtenemos fracaso
La función de masa es: P (X = 0) = 1 − p y P (X = 1) = p. Los parámetros esperanza y varianza de
una variable X con distribución de Bernoulli son:
E[X] = p ,
V [X] = p (1 − p) ;
obtenidos ambos de manera sencilla a partir de la definición. Para abreviar escribiremos X ∼ B(1; p)
para indicar que X es una variable aleatoria con distribución de Bernoulli con esperanza p.
63
Modelos discretos
4.1.2
Distribución binomial
Definición 4.1.3. Supongamos que realizamos n pruebas de Bernoulli independientes, con P (E) = p
en cada prueba. Sea X la variable “número de éxitos obtenidos en las n pruebas”. Llamamos distribución binomial a la distribución de esta variable X. Denotaremos por B(n; p) la distribución
binomial de parámetros n = “número de pruebas de Bernoulli” y p = P (E) en cada prueba.
Si X sigue una distribución B(n; p), escribiremos X ∼ B(n; p), y su función de masa es:
µ ¶
n i
p (1 − p)n−i ,
P (X = i) =
i
i = 0, 1, 2, . . . , n .
Obsérvese que si tomamos una prueba de Bernoulli con p(E) = p, y consideramos la variable X
con valores 1 si éxito, 0 si fracaso, entonces X ∼ B(1; p).
También, si tomamos n variables Xi independientes, todas y cada una de ellas siguiendo la misma
distribución B(1; p), entonces la variable
X = X1 + X2 + · · · + Xn
sigue una distribución B(n; p). En particular, la esperanza y la varianza de X ∼ B(n; p) son:
E[X] = n · p ,
V [X] = n · p · (1 − p) ;
puesto que p = E[Xi ] y p · (1 − p) = V [Xi ] para cada una de las variables independientes que
sumamos.
4.1.3
Otros modelos basados en pruebas de Bernoulli
Definición 4.1.4. Realizamos pruebas de Bernoulli independientes con la misma distribución dada
por P (E) = p. La distribución geométrica de parámetro p es la de la variable aleatoria:
X = “número de pruebas hasta el primer éxito”.
Su función de masa es:
P (X = j) = (1 − p)j−1 · p ,
j = 1, 2, 3, . . . .
Se puede probar que:
E[X] =
1
;
p
V [X] =
1−p
.
p2
Ejercicio 1 Demostrar que si X sigue una distribución geométrica de parámetro p, entonces
E[X] =
64
1
.
p
Modelos de probabilidad
Solución: Por definición se tiene:
E[X] = 1 · p + 2 · (1 − p) · p + 3 · (1 − p)2 · p + 4 · (1 − p)3 + 5(1 − p)4 + · · ·
¡
¢
= p · 1 + 2(1 − p) + 3(1 − p)2 + 4 · (1 − p)3 + 5(1 − p)4 + · · ·
¡
= p · 1 + (1 − p) + (1 − p)2 + (1 − p)3 + (1 − p)4 + · · ·
+ (1 − p) + (1 − p)2 + (1 − p)3 + (1 − p)4 + · · ·
+ (1 − p)2 + (1 − p)3 + (1 − p)4 + · · ·
+ (1 − p)3 + (1 − p)4 + · · ·
¢
+ (1 − p)4 + · · ·
´
³ 1 1 − p (1 − p)2 (1 − p)3 (1 − p)4
= p
+
+
+
+
+ ···
p
p
p
p
p
1
= 1 + (1 − p) + (1 − p)2 + (1 − p)3 + (1 − p)4 + · · · = .
p
Definición 4.1.5. Consideramos pruebas de Bernoulli independientes con la misma distribución
dada por p = P (E). Para cada número fijo r, se define la variable
X = “número de pruebas hasta el r–ésimo éxito” .
Decimos que la variable X sigue una distribución binomial negativa de parámetros r y p,
X ∼ BN (r; p), y su función de masa viene dada por:
¶
µ
r+j−1 r
p (1 − p)j , j = 0, 1, 2, . . . .
P (X = r + j) =
j
La distribución BN (r; p) para r = 1 es una geométrica. De hecho, si realizamos pruebas de
Bernoulli con p = P (E), hasta conseguir r éxitos y se definen las variables:
Xi = número de pruebas entre el (i − 1)–ésimo éxito y el i–ésimo,
i = 1, 2, . . . , r
cada Xi es una geométrica de parámetro p. Entonces
X = X1 + X2 · · · + Xr
sigue una distribución BN (r; p). Así vemos que si X ∼ BN (r; p) entonces:
E[X] =
4.1.4
r
;
p
V [X] =
r(1 − p)
.
p2
Distribución de Poisson
Supongamos que estamos interesados en estudiar el número de éxitos obtenidos en un número grande
de pruebas independientes de Bernoulli, teniendo una probabilidad pequeña de éxito en cada prueba.
Es razonable pensar que la distribución venga dada como límite de una distribución B(n; p) con
n → ∞, p → 0. De hecho si se tiene cierto control sobre el producto np, digamos np → λ < ∞
65
Modelos continuos
cuando n → ∞ y p → 0, podemos calcular el límite. Surge así la distribución de Poisson de parámetro
λ > 0 definida por la función de masa:
P (X = j) =
λj · e−λ
,
j!
j = 0, 1, 2, . . . .
Si X ∼ Poisson(λ), informalmente, se obtiene: E[X] = lı́m n · p = λ y V [X] = lı́m np(1 − p) = λ.
Usaremos la distribución de Poisson cuando estemos estudiando un modelo binomial, B(n ; p),
con un número grande de pruebas, cada una con probabilidad de éxito pequeña. A título orientativo,
sustituiremos la B(n ; p) por una Poisson(λ), con λ = np, cuando n ≥ 30 y p ≤ 0.1.
Es fácil comprobar que la función dada arriba es una función de masa puesto que:
∞
X
∞
∞
X
X
λj · e−λ
λj
−λ
P (X = j) =
=e
= e−λ · eλ = 1 .
j!
j!
j=0
j=0
j=0
Ejercicio 2 Demostrar que el límite cuando n → ∞, p → 0, con np → λ, de la función de masa de
una B(n; p) es la función de masa de una distribución de Poisson con parámetro λ, en otras palabras
si np → λ cuando n → ∞ y p → 0:
µ ¶
n j
λj · e−λ
lı́m
p (1 − p)n−j =
,
cuando n → ∞, p → 0 .
j
j!
Solución: :
µ ¶
n j
n(n − 1)(n − 2) · · · · · (n − j + 1) j (1 − p)n
lı́m
p (1 − p)n−j = lı́m
·p ·
j
j!
(1 − p)j
µ
¶µ
¶
µ
¶
1
1
2
j−1
(1 − p)n
j
=
lı́m n · 1 −
1−
· ··· · 1 −
· pj ·
j!
n
n
n
(1 − p)j
µ
¶µ
¶
µ
¶
n
1
2
j−1
1
j (1 − p)
=
lı́m 1 −
1−
· ··· · 1 −
· (n · p) ·
j!
n
n
n
(1 − p)j
1
e−λ
λj · e−λ
=
1 · λj
=
.
j!
1
j!
4.2
4.2.1
Modelos continuos
Distribución uniforme
Definición 4.2.1. Decimos que una variable aleatoria X sigue una distribución uniforme en
un intervalo (a, b) de la recta real, X ∼ U (a, b), si su función de densidad es:
f (x) =
1
b−a
si x ∈ (a, b) ,
Si X ∼ U (a, b) entonces µ = E[X] =
f (x) = 0
en otro caso.
1
a+b
y σ 2 = V [X] = (b − a)2 .
2
12
66
Modelos de probabilidad
4.2.2
Distribución exponencial
Definición 4.2.2. Una variable aleatoria X se dice que sigue una distribución exponencial de
parámetro λ > 0, X ∼ Exp(λ), si su función de densidad es
f (x) = λe−λx
si x > 0 ,
Si X ∼ Exp(λ) entonces:
µ = E[X] =
4.2.3
1
,
λ
f (x) = 0
σ 2 = V [X] =
si x ≤ 0 .
1
.
λ2
Distribución Normal
Definición 4.2.3. De una variable aleatoria X diremos que sigue una distribución normal de
media µ y desviación típica σ, X ∼ N(µ; σ), si su función de densidad es:
(x−µ)2
1
f (x) = √ e− 2σ2 ,
σ 2π
para todo x ∈ R .
Si X ∼ N(µ; σ) entonces:
E[X] = µ ,
V [X] = σ 2 .
La función de densidad de una distribución N (µ; σ) tiene propiedades muy interesantes:
1. Su gráfica es simétrica respecto a la media µ:
µ−σ
µ
µ+σ
de manera que: P (X < µ − a) = P (X > µ + a), para todo a > 0.
X −µ
2. Si X ∼ N(µ; σ) y Z =
entonces Z ∼ N(0; 1). En esta situación, nos referiremos al cambio
σ
X −µ
de variable Z =
, como tipificación de la variable X ∼ N(µ; σ), y a la correspondiente
σ
Z ∼ N(0; 1) como la distribución normal tipificada.
La tipificación de cualquier normal, X ∼ N(µ; σ), nos permitirá calcular la probabilidad de un
suceso correspondiente a ella a partir de la tabla de la distribución normal tipificada N(0; 1).
Así, por ejemplo, si X ∼ N(µ; σ) entonces:
P (a < X < b) = P
¡b − µ¢
¡a − µ¢
¡a − µ
b − µ¢
<Z<
= FZ
− FZ
,
σ
σ
σ
σ
donde Z ∼ N(0; 1) y FZ (z) = P (Z ≤ z) es su función de distribución, cuyos valores vienen
dados por una tabla.
67
Problemas
3. La distribución B(n; p) tiende a una distribución normal cuando n → ∞ y p es fijo. Así si
estamos con una distribución binomial con n grande, la podremos aproximar por una normal
N (µ; σ) con parámetros:
p
µ = n · p , σ = n p (1 − p) .
A título orientativo es aconsejable realizar esta sustitución cuando n ≥ 30 y 0.1 < p < 0.9.
4. Si X1 ∼ N(µ1 ; σ1 ), X2 ∼ N(µ2 ; σ2 ), . . . , Xn ∼ N(µn ; σn ) son variables independientes entonces:
q
X = X1 + X2 + · · · + Xn ∼ N(µ = µ1 + µ2 + · · · + µn ; σ = σ12 + σ22 + · · · + σn2 )
q
Y = X1 − X2 ∼ N(µ = µ1 − µ2 ; σ = σ12 + σ22 ) .
Problemas
1. En una cadena de producción dos robots funcionan conectados, respectivamente, a cinco y seis
ordenadores independientes entre sí, de manera que en un tiempo dado t de funcionamiento
falla un ordenador del primer robot (resp. segundo) con probabilidad 0.1 (resp. 0.2). Calcúlense
las probabilidades de que en un tiempo t de funcionamiento fallen:
(a) un ordenador del primer robot;
(b) al menos un ordenador del primer robot;
(c) cinco ordenadores del segundo robot;
(d) no más de cinco ordenadores del segundo robot;
(e) exactamente dos ordenadores del primer robot y tres del segundo;
(f) tres ordenadores más del primero que del segundo robot.
2. Un lote de piezas contiene una proporción p de defectuosas. Para realizar un control de calidad
se seleccionan n piezas y se denomina X el número de piezas defectuosas encontradas.
(a) Calcúlese P (X = 0).
(b) Si p = 0.1, ¿cuál debe ser el número de piezas, n, examinadas para tener P (X = 0) < 0.05?
(c) Si n = 40, ¿para qué valores de p es P (X = 0) < 0.01?
(d) Si se examinan n = 80 piezas y se encuentran dos defectuosas, ¿cuál es la proporción más
verosímil de piezas defectuosas en el lote total: el 1 %, el 4 % ó el 7 %?
3. En una población se sabe que, en promedio, uno de cada 20 habitantes tiene teléfono móvil.
¿Cuál es la probabilidad de que al realizar una encuesta, el cuarto encuestado sea el primero
con teléfono móvil?
4. Se extraen una a una con reemplazamiento cartas de una baraja española. Calcúlese la probabilidad de obtener 5 cartas que no sean oros antes de obtener el tercer oro.
68
Modelos de probabilidad
5. El dueño de una ferretería, extrae al azar 50 tornillos de cada lote que recibe. Si en la muestra no
encuentra más de 3 defectuosos, se queda el lote, en caso contrario lo rechaza. Un representante
le envía un lote que contiene un 10 % de tornillos defectuosos, ¿cuál es la probabilidad de que
acepte el lote?
6. En cierto tramo de una carretera la probabilidad de que un coche supere la velocidad máxima
permitida es 0.0001. Si recorren ese tramo 20000 coches, calcúlese la probabilidad de que
(a) ninguno supere la velocidad máxima permitida;
(b) a lo sumo 5 superen la velocidad máxima permitida.
7. Se ha observado el número de fallos cometidos en un folio por un mecanógrafo en un tiempo
fijado. Estos fallos se han anotado en la siguiente tabla:
número de fallos
frecuencia
0
42
1
30
2
16
3
12
4
4
5
1
Ajústese una distribución de Poisson y calcúlese la probabilidad de que en un folio seleccionado
al azar, de entre los escritos por este mecanógrafo, aparezcan más de tres fallos.
8. Se sabe que la demanda de un producto de consumo sigue una distribución normal de media
95 y desviación típica 7. Calcúlese:
(a) la probabilidad de que la demanda sea menor que 97;
(b) la probabilidad de que la demanda sea mayor que 99;
(c) la probabilidad de que la demanda esté entre 92 y 96;
(d) la mínima cantidad disponible necesaria para poder atender la demanda con una probabilidad no menor que 0.95 .
9. En cierto país, el 20 % de la población se muestra preocupada por el incremento de las emisiones
de dióxido de carbono. Se hace una encuesta a 15 personas.
(a) ¿Cuál es la probabilidad de que ninguna de ellas esté preocupada por el incremento de las
emisiones de dióxido de carbono?
(b) Halla la probabilidad de que no haya más de tres personas preocupadas.
(c) Calcula la probabilidad de que al menos tres personas entre las 15 estén preocupadas.
(d) ¿Cuál es la esperanza y la desviación típica del número de personas preocupadas entre las
15? Si en lugar de al 20 %, sólo al 2 % de los habitantes del país les preocupa el problema,
¿cómo cambian la esperanza y la desviación típica?
10. Consideramos un experimento aleatorio consistente en tirar 400 veces una moneda.
(a) Halla la probabilidad aproximada de que el número de caras obtenido esté comprendido
entre 160 y 190.
(b) Halla el intervalo (a, b) centrado en 200, tal que la probabilidad aproximada de que el
número de caras obtenido esté en dicho intervalo sea 0.95.
69
Problemas
11. Un zoólogo estudia cierta especie de ratones de campo. Para ello, captura ejemplares de ratones
en un bosque en el que la proporción de ratones de campo de la especie que le interesa es p.
(a) Si p = 0.3, calcula la probabilidad de que entre 6 ejemplares capturados haya al menos 2
de la especie que le interesa.
(b) Si p = 0.05, calcula la probabilidad de que entre 200 ejemplares capturados, haya exactamente 3 de la especie que le interesa.
(c) Si p = 0.4, calcula la probabilidad de que entre 200 ejemplares capturados, haya entre 75
y 110 de la especie que le interesa.
(d) ¿Cuál es el número medio de ejemplares que tendrá que capturar hasta encontrar uno de
la especie que le interesa, si p = 0.2 ?
12. Se supone que el número de bacterias por cm3 de agua en un estanque es una variable aleatoria
X con distribución de Poisson de parámetro λ = 0.5.
(a) ¿Cuál es la probabilidad de que en un cm3 de agua del estanque no haya ninguna bacteria?
(b) En 40 tubos de ensayo se toman muestras de agua del estanque (1 cm3 de agua en cada
tubo). ¿Qué distribución sigue la variable Y que representa el número de tubos de ensayo,
entre los 40, que no contienen bacterias? Calcula P (Y ≥ 20).
(c) Si sabemos que en un tubo hay bacterias, ¿cuál es la probabilidad de que haya menos de
tres?
13. En el sur de California se produce, en promedio, un terremoto al año de magnitud 6.1 o mayor
en la escala de Richter1 . Se supone que el número de terremotos al año en esta zona sigue un
proceso de Poisson.
(a) ¿Cuál es la probabilidad de que se produzcan más de dos terremotos en cinco años?
(b) ¿Cuál es la probabilidad de que haya un periodo de 15 meses sin que haya terremotos?
(c) ¿Cuál es la probabilidad de que haya que esperar más de tres años y medio para que se
produzcan dos terremotos?
14. La probabilidad de que una pieza tenga un fallo durante el primer año de funcionamiento es
0.001. Halla la probabilidad de que, entre 2000 piezas, presenten un fallo (a) exactamente tres,
(b) más de 2.
1
Magnitud
menos de 3.5
3.5–5.4
5.5–6.0
6.1–6.9
7.0–7.9
8 ó mayor
Escala Ritcher
Efectos del terremoto
Generalmente no se siente, pero es registrado
A menudo se siente, pero sólo causa daños menores
Ocasiona daños ligeros a edificios
Puede ocasionar daños severos en áreas muy pobladas
Terremoto mayor. Causa graves daños
Gran terremoto. Destrucción total a comunidades cercanas
Fuente: http://www.angelfire.com/ri/chterymercalli
70
Modelos de probabilidad
15. La variable X expresa el tiempo en segundos que tarda una depuradora en filtrar 10 mm3 de
agua y sigue una distribución exponencial con media 10. Calcula la probabilidad de que tarde
entre tres y doce segundos en depurar 10 mm3 .
16. Para estudiar la viabilidad económica de una mina de carbón, consideramos la variable aleatoria
X=“Kilogramos de carbón obtenidos por tonelada de mineral”. Supongamos que, en cierta mina,
X sigue una N(µ = 150; σ = 25).
(a) Calcula la probabilidad de que, en una tonelada de mineral, el contenido de carbón sea
superior a 130 kg.
(b) Calcula la probabilidad de que, en 2 toneladas de mineral extraídas independientemente,
la diferencia en el contenido de carbón sea inferior a 30 kg.
(c) Extraemos independientemente 100 toneladas de mineral. Calcula la probabilidad de que
en más de 80 de ellas el contenido de carbón sea superior a 130 kg.
17. En una fábrica, se están produciendo cuerdas con cierta fibra sintética. La resistencia a la
tensión de estas cuerdas sigue una distribución N(µ = 30; σ = 2).
(a) ¿Cuál es el porcentaje de cuerdas cuya resistencia a la tensión está entre 28 y 32?
(b) En un pedido de 200 cuerdas, ¿cuál es la probabilidad de que más de 140 presenten una
resistencia a la tensión entre 28 y 32?
(c) En un pedido de 250 cuerdas, ¿cuál es la probabilidad de que alguna presente una resistencia inferior a 25?
18. Un fabricante produce varillas y recipientes para insertar las varillas. Ambos tienen secciones
circulares. Los diámetros de las varillas siguen una distribución N(µ = 1; σ = 0.2); los diámetros
de los recipientes siguen una distribución N (µ = 1.05; σ = 0.15). Un ingeniero selecciona al
azar una varilla y un recipiente. ¿Cuál es la probabilidad de que la varilla pueda insertarse en
el recipiente?
19. Para analizar si las aguas próximas a la costa están contaminadas cuando se produce una marea
negra por el hundimiento de un petrolero, se analizan varias muestras con un test que se divide
en tres pruebas independientes. Los resultados varían aleatoriamente de unas muestras a otras
y se sabe que siguen distribuciones normales dadas por:
X
Y
Z
=
=
=
resultados de la primera prueba del test, X ∼ N(7; 1)
resultados de la segunda prueba del test, Y ∼ N(5; σ = 2)
resultados de la tercera prueba del test, Z ∼ N(6; 1)
Se elige una muestra al azar. Contesta a las siguientes preguntas:
(a) Si el resultado final del test es el promedio de los valores que se obtienen en las tres
pruebas, ¿cuál es la probabilidad de que el resultado del test sea superior a 5?
(b) ¿Cuál es la probabilidad de que el resultado de las tres pruebas sea superior a 5?
20. Una compañía de petróleo tiene un contrato para vender grasa en envases de 500 gramos. La
cantidad de grasa que la máquina de llenado pone en los envases sigue una Normal con la media
que el encargado elija y σ = 25. ¿Qué valor medio deberá elegir el encargado si la compañía no
desea que le rechacen más del 2 % de los envases por tener un peso por debajo de lo especificado?
71
Problemas
21. Una máquina de envasado llena sacos de fertilizante de aproximadamente 30 kg. La “cantidad
de fertilizante por saco” sigue una distribución N (µ = 30; σ = 1).
(a) Se desea que la cantidad de fertilizante por saco esté entre 29 y 31 kg. Calcula la probabilidad de que la cantidad esté dentro de esos límites.
(b) Una empresa realiza un pedido de 80 de estos sacos de fertilizante. Calcular la probabilidad
de que más de 50 estén dentro de los límites indicados.
22. La permeabilidad intrínseca del hormigón producido en una fábrica química sigue una distribución N (µ = 40; σ = 5). Se reciben 60 remesas de hormigón.
(a) ¿Cuál es la probabilidad de que alguna remesa tenga una permeabilidad intrínseca inferior
a 30?
(b) El 30 % de las remesas de hormigón enviadas a un almacén tiene una permeabilidad que
sigue una N (µ = 40; σ = 5). El 70 % de las remesas restantes tiene una permeabilidad
que sigue una N (µ = 45; σ = 10). ¿Cuál es el porcentaje total de remesas que tienen una
permeabilidad inferior a 35?
72