Download Estadística I - GEOCITIES.ws

Document related concepts
no text concepts found
Transcript
Universidad Panamericana
Estadística I
Prof. Andrés Sandoval H
Estadística I
5. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
5.1 Distribución binomial
Es un ejemplo de distribución de probabilidad discreta. Las características que
debe cumplir una distribución de probabilidad para considerarse binomial, son:




El resultado de cada ensayo dentro del experimento se clasifica en dos
categorías mutuamente excluyentes: éxito o fracaso.
La variable aleatoria cuenta el número de éxitos en un número fijo de
ensayos.
La probabilidad de éxito permanece igual para todos los ensayos. Lo mismo
ocurre con la probabilidad de fracaso.
Los ensayos son independientes. La ocurrencia de uno no afecta la
probabilidad de ocurrencia de otro.
La expresión matemática de este tipo de distribución es la siguiente:
DISTRIBUCIÓN DE PROBABILIDAD
BINOMIAL
P ( X ) = nCx px (1 – p) n – x
Donde:
C = denota una combinación
n = es el número de ensayos
x = es el número de éxitos
p = es la probabilidad de cada ensayo
Un ejemplo en el que se usa la distribución binomial es el siguiente:
Cada día Aeroméxico tiene 5 vuelos México – Colima. Supón que para cada vuelo,
la probabilidad de que este se retrase es de 0.20.
a) ¿Cuál es la probabilidad de que ninguno de los vuelos se retrase?
b) ¿Cuál es la probabilidad de que exactamente 1 vuelo se retrase?
Universidad Panamericana
Estadística I
Prof. Andrés Sandoval H
a) La probabilidad de que ninguno de los vuelos se retrase es de 0.3277 ó 33%
P ( X ) = nCx px (1 – p) n – x
P ( 0 ) = 5C0 (0.20)0 (1 – 0.20) 5 – 0
P ( 0 ) = (1) (1) (0.3277)
P ( 0 ) = 0.3277
b) La probabilidad de que exactamente un vuelo se retrase es de 0.4096 ó 41%
P ( X ) = nCx px (1 – p) n – x
P ( 1 ) = 5C1 (0.20)1 (1 – 0.20) 5 – 1
P ( 1 ) = (5) (0.20) (0.4096)
P ( 1 ) = 0.4096
La distribución binomial completa para n=5, p=0.20 es la siguiente:
Número de vuelos Probabilidad
Con retraso (n)
(x)
0
0.3277
1
0.4096
2
0.2048
3
0.0512
4
0.0064
5
0.0003
Total
1
La representación gráfica de esta distribución de probabilidad sería la siguiente:
Distribución de la probabilidad de retraso en los
vuelos de Aeroméxico (México - Colima)
Probabilidad
0.5
0.4
0.3
0.2
0.1
0
0
1
2
3
Número de vuelos
4
5
Universidad Panamericana
Estadística I
Prof. Andrés Sandoval H
http://personal5.iddeo.es/ztt/Tem/t19_distribucion_binomial.htm
Tablas de probabilidad binomial
Una distribución de probabilidad binomial es una distribución teórica, que se puede
calcular mediante el uso de una fórmula. Sin embargo, los cálculos pueden ser
muy tediosos. Por tal motivo existen tablas en las que se pueden consultar las
probabilidades de un determinado número de éxitos para varios valores de n y de
p.
5.2 Distribución de Poisson
Se utiliza cuando las probabilidades de éxito (p) son menores a 0.05 y cuando (n)
es muy grande (p.e. mayor a 100).
Por lo demás tiene casi las mismas características que una distribución binomial
simple. Se le conoce también como ley de los eventos improbables.
DISTRIBUCIÓN DE PROBABILIDAD
DE POISSON
P ( X ) = μx e – μ
x!
Donde:
μ = Número promedio de éxitos durante un intervalo específico
e = Constante 2.71828 (Base del sistema de logaritmos naturales)
x = Número de éxitos
Una diferencia entre una distribución binomial simple y la de Poisson es que, a
diferencia de la binomial (dónde debe existir un número fijo de ensayos), para la
distribución de Poisson X puede asumir un número infinito de valores.
Un ejemplo donde se usa la distribución de Poisson es el siguiente:
Una empresa que se dedica a crear alimentos transgénicos experimenta
problemas con una plaga llamada gusano del maíz. El examen de 5000 mazorcas
seleccionadas al azar reveló que se encontraron en total 3500 gusanos.
Universidad Panamericana
Estadística I
Prof. Andrés Sandoval H
a) ¿Cuál es la probabilidad de que una mazorca seleccionada al azar no tenga
gusanos?
b) Desarrolla una distribución de probabilidad de Poisson para este
experimento.
a) p (x = 0) = 0.4966, que se encuentra de:
μ = 3500 / 5000 = 0.7
Se utilizan las tablas de distribución de probabilidad de Poisson, haciendo
referencia a una μ = 0.7 y una X = 0
b)
Número de éxitos
x
0
1
2
3
4
5
6
Probabilidad de ocurrencia
P (x)
0.4966
0.3476
0.1217
0.0284
0.0050
0.0007
0.0001
Una representación gráfica de esta distribución de probabilidad es la siguiente:
Distribución de probabilidad de Poissin para
μ = 0.7
Probabilidad
0.5
0.4
0.3
0.2
0.1
0
0
1
2
3
4
Número de gusanos
5
6
Universidad Panamericana
Estadística I
Prof. Andrés Sandoval H
En resumen, la distribución de Poisson es parte del grupo de distribuciones
discretas. Para aplicarla, n debe ser grande y p debe ser pequeña. Todo lo que se
necesita para construir una distribución de Poisson es μ, que es el número
promedio de éxitos durante un intervalo específico. μ se calcula multiplicando n
por p.
5.3 Distribución Hipergeométrica
http://www.elosiodelosantos.com/hipergeometrica.html
Su aplicación exige los mismos requisitos de la distribución binomial, con la
variante de que para la Hipergeométrica la probabilidad de éxito no permanece
igual de un ensayo al siguiente. Otras características que se deben cumplir son:


Que se seleccione una muestra de una población finita y sin reemplazo.
Que el tamaño de la muestra (n) sea más de 5% de la población (N).
DISTRIBUCIÓN DE PROBABILIDAD
HIPERGEOMÉTRICA
P ( X ) = (s C x ) (N - S C n - x )
NC n
Donde:
N = Tamaño de la población
s = # de éxitos en la población
x = # de éxitos que son de interés
n = Tamaño de la muestra o # de ensayos
C = Denota una combinación
Un ejemplo donde se usa la distribución Hipergeométrica es el siguiente:
Suponga que durante la semana se fabricaron 50 estaciones de juego para video.
Cuarenta de ellas funcionaron perfectamente, y diez tuvieron al menos un defecto.
Se seleccionó al azar una muestra de cinco. Utilizando la fórmula
Hipergeométrica, ¿cuál es la probabilidad de que 4 de los 5 funcionen
perfectamente?
P ( 4 ) = (40 C 4 ) (50 - 40 C 5 - 4 )
50 C 5
P ( 4 ) = (91 390) (10)
2 118 760
P ( 4 ) = .431
Universidad Panamericana
Estadística I
Prof. Andrés Sandoval H
Por lo tanto, la probabilidad de seleccionar 5 estaciones de juego y encontrar que
4 funcionan perfectamente es de 0.431.
A fin de comparar las distribuciones de probabilidad binomial e Hipergeométrica, la
siguiente tabla muestra las probabilidades binomial aproximada e Hipergeométrica
para el problema de las estaciones de juego.
Como 40 de las 50 estaciones funcionan perfectamente, la probabilidad binomial
de elegir una estación de juego que funcione correctamente en un ensayo es
40/50 = 0.80; las probabilidades binomiales de la tabla provienen de la tabla de
probabilidad binomial n = 5, p = 0.80.
Número de estaciones de
juego en la muestra que
funcionan de manera
correcta
x
0
1
2
3
4
5
Probabilidad
Hipergeométrica
P(x)
Probabilidad binomial
n = 5, p = 0.80
.000
.004
.044
.210
.431
.311
.000
.006
.051
.205
.410
.328
Cuando no es posible cumplir el requerimiento binomial de una probabilidad
constante de éxito, se utiliza en su lugar la distribución Hipergeométrica. Como se
observa en la tabla las probabilidades son muy semejantes. Así cuando para una
distribución Hipergeométrica no se cumple el requisito de una muestra mayor a
5% de la población, se puede usar la distribución binomial para aproximar el
resultado.