Download Estadística I - GEOCITIES.ws
Document related concepts
no text concepts found
Transcript
Universidad Panamericana Estadística I Prof. Andrés Sandoval H Estadística I 5. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 5.1 Distribución binomial Es un ejemplo de distribución de probabilidad discreta. Las características que debe cumplir una distribución de probabilidad para considerarse binomial, son: El resultado de cada ensayo dentro del experimento se clasifica en dos categorías mutuamente excluyentes: éxito o fracaso. La variable aleatoria cuenta el número de éxitos en un número fijo de ensayos. La probabilidad de éxito permanece igual para todos los ensayos. Lo mismo ocurre con la probabilidad de fracaso. Los ensayos son independientes. La ocurrencia de uno no afecta la probabilidad de ocurrencia de otro. La expresión matemática de este tipo de distribución es la siguiente: DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL P ( X ) = nCx px (1 – p) n – x Donde: C = denota una combinación n = es el número de ensayos x = es el número de éxitos p = es la probabilidad de cada ensayo Un ejemplo en el que se usa la distribución binomial es el siguiente: Cada día Aeroméxico tiene 5 vuelos México – Colima. Supón que para cada vuelo, la probabilidad de que este se retrase es de 0.20. a) ¿Cuál es la probabilidad de que ninguno de los vuelos se retrase? b) ¿Cuál es la probabilidad de que exactamente 1 vuelo se retrase? Universidad Panamericana Estadística I Prof. Andrés Sandoval H a) La probabilidad de que ninguno de los vuelos se retrase es de 0.3277 ó 33% P ( X ) = nCx px (1 – p) n – x P ( 0 ) = 5C0 (0.20)0 (1 – 0.20) 5 – 0 P ( 0 ) = (1) (1) (0.3277) P ( 0 ) = 0.3277 b) La probabilidad de que exactamente un vuelo se retrase es de 0.4096 ó 41% P ( X ) = nCx px (1 – p) n – x P ( 1 ) = 5C1 (0.20)1 (1 – 0.20) 5 – 1 P ( 1 ) = (5) (0.20) (0.4096) P ( 1 ) = 0.4096 La distribución binomial completa para n=5, p=0.20 es la siguiente: Número de vuelos Probabilidad Con retraso (n) (x) 0 0.3277 1 0.4096 2 0.2048 3 0.0512 4 0.0064 5 0.0003 Total 1 La representación gráfica de esta distribución de probabilidad sería la siguiente: Distribución de la probabilidad de retraso en los vuelos de Aeroméxico (México - Colima) Probabilidad 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 Número de vuelos 4 5 Universidad Panamericana Estadística I Prof. Andrés Sandoval H http://personal5.iddeo.es/ztt/Tem/t19_distribucion_binomial.htm Tablas de probabilidad binomial Una distribución de probabilidad binomial es una distribución teórica, que se puede calcular mediante el uso de una fórmula. Sin embargo, los cálculos pueden ser muy tediosos. Por tal motivo existen tablas en las que se pueden consultar las probabilidades de un determinado número de éxitos para varios valores de n y de p. 5.2 Distribución de Poisson Se utiliza cuando las probabilidades de éxito (p) son menores a 0.05 y cuando (n) es muy grande (p.e. mayor a 100). Por lo demás tiene casi las mismas características que una distribución binomial simple. Se le conoce también como ley de los eventos improbables. DISTRIBUCIÓN DE PROBABILIDAD DE POISSON P ( X ) = μx e – μ x! Donde: μ = Número promedio de éxitos durante un intervalo específico e = Constante 2.71828 (Base del sistema de logaritmos naturales) x = Número de éxitos Una diferencia entre una distribución binomial simple y la de Poisson es que, a diferencia de la binomial (dónde debe existir un número fijo de ensayos), para la distribución de Poisson X puede asumir un número infinito de valores. Un ejemplo donde se usa la distribución de Poisson es el siguiente: Una empresa que se dedica a crear alimentos transgénicos experimenta problemas con una plaga llamada gusano del maíz. El examen de 5000 mazorcas seleccionadas al azar reveló que se encontraron en total 3500 gusanos. Universidad Panamericana Estadística I Prof. Andrés Sandoval H a) ¿Cuál es la probabilidad de que una mazorca seleccionada al azar no tenga gusanos? b) Desarrolla una distribución de probabilidad de Poisson para este experimento. a) p (x = 0) = 0.4966, que se encuentra de: μ = 3500 / 5000 = 0.7 Se utilizan las tablas de distribución de probabilidad de Poisson, haciendo referencia a una μ = 0.7 y una X = 0 b) Número de éxitos x 0 1 2 3 4 5 6 Probabilidad de ocurrencia P (x) 0.4966 0.3476 0.1217 0.0284 0.0050 0.0007 0.0001 Una representación gráfica de esta distribución de probabilidad es la siguiente: Distribución de probabilidad de Poissin para μ = 0.7 Probabilidad 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 4 Número de gusanos 5 6 Universidad Panamericana Estadística I Prof. Andrés Sandoval H En resumen, la distribución de Poisson es parte del grupo de distribuciones discretas. Para aplicarla, n debe ser grande y p debe ser pequeña. Todo lo que se necesita para construir una distribución de Poisson es μ, que es el número promedio de éxitos durante un intervalo específico. μ se calcula multiplicando n por p. 5.3 Distribución Hipergeométrica http://www.elosiodelosantos.com/hipergeometrica.html Su aplicación exige los mismos requisitos de la distribución binomial, con la variante de que para la Hipergeométrica la probabilidad de éxito no permanece igual de un ensayo al siguiente. Otras características que se deben cumplir son: Que se seleccione una muestra de una población finita y sin reemplazo. Que el tamaño de la muestra (n) sea más de 5% de la población (N). DISTRIBUCIÓN DE PROBABILIDAD HIPERGEOMÉTRICA P ( X ) = (s C x ) (N - S C n - x ) NC n Donde: N = Tamaño de la población s = # de éxitos en la población x = # de éxitos que son de interés n = Tamaño de la muestra o # de ensayos C = Denota una combinación Un ejemplo donde se usa la distribución Hipergeométrica es el siguiente: Suponga que durante la semana se fabricaron 50 estaciones de juego para video. Cuarenta de ellas funcionaron perfectamente, y diez tuvieron al menos un defecto. Se seleccionó al azar una muestra de cinco. Utilizando la fórmula Hipergeométrica, ¿cuál es la probabilidad de que 4 de los 5 funcionen perfectamente? P ( 4 ) = (40 C 4 ) (50 - 40 C 5 - 4 ) 50 C 5 P ( 4 ) = (91 390) (10) 2 118 760 P ( 4 ) = .431 Universidad Panamericana Estadística I Prof. Andrés Sandoval H Por lo tanto, la probabilidad de seleccionar 5 estaciones de juego y encontrar que 4 funcionan perfectamente es de 0.431. A fin de comparar las distribuciones de probabilidad binomial e Hipergeométrica, la siguiente tabla muestra las probabilidades binomial aproximada e Hipergeométrica para el problema de las estaciones de juego. Como 40 de las 50 estaciones funcionan perfectamente, la probabilidad binomial de elegir una estación de juego que funcione correctamente en un ensayo es 40/50 = 0.80; las probabilidades binomiales de la tabla provienen de la tabla de probabilidad binomial n = 5, p = 0.80. Número de estaciones de juego en la muestra que funcionan de manera correcta x 0 1 2 3 4 5 Probabilidad Hipergeométrica P(x) Probabilidad binomial n = 5, p = 0.80 .000 .004 .044 .210 .431 .311 .000 .006 .051 .205 .410 .328 Cuando no es posible cumplir el requerimiento binomial de una probabilidad constante de éxito, se utiliza en su lugar la distribución Hipergeométrica. Como se observa en la tabla las probabilidades son muy semejantes. Así cuando para una distribución Hipergeométrica no se cumple el requisito de una muestra mayor a 5% de la población, se puede usar la distribución binomial para aproximar el resultado.