Download Probabilidad y Estadística
Document related concepts
no text concepts found
Transcript
Probabilidad y Estadística Distribuciones Teóricas de Probabilidad Las funciones teóricas de probabilidad corresponden a modelos que permiten expresar teorías sobre el comportamiento ideal de una variable en la realidad. Se utilizan para: Expresar lo que puede esperarse de un universo Como fuente de referencia Cuando las distribuciones observadas son difíciles de formalizar Sirve para realizar inferencias y elaborar predicciones sobre el comportamiento de una variable. Las funciones teóricas de probabilidad correspondientes a variables discretas: •Binomial •Hipergeométrica •Poisson •Multinomial •Uniforme Discreta •Geométrica •Binomial Negativa Si la variable aleatoria es continua La Normal Uniforme Continua Exponencial DISTRIBUCIONES DISCRETAS DE PROBABILIDAD La determinación de un modelo teórico discreto de probabilidades para aplicarlo a un caso observado, se realiza tomando en cuenta las siguientes características. •La naturaleza del número de pruebas del experimento ( fijo o variable) •La naturaleza de los resultados del experimento (dicotómico o no) •El carácter de la probabilidad de cada prueba (Constante o variable) •La determinación del carácter del experimento( Sucesos dependientes o no) Distribución Binomial Se utiliza de modelo cuando: •El número de pruebas o ensayos es fijo n •El resultado sólo puede tomar una de dos formas (éxito o fracaso) cada resultado es mutuamente excluyente. •La probabilidad de éxito “p”, permanece constante de un ensayo a otro y lo mismo sucede con el fracaso “q” tal que p + q = 1. •Los ensayos son independientes, lo que significa que el resultado de un ensayo no afecta al resultado de algún otro.Esta condición puede asegurarse mediante un muestreo con reposición en poblaciones finitas o el muestreo de poblaciones infinitas o muy grandes La distribución probabilística binomial n x n− x P( x) = p q x Donde: Media esperada: µ = E ( x) = np n n! = x (n − x)! x! Varianza esperada Simbología σ 2 = V ( x) = npq b(n,p,x) Ejemplo: En un día veraniego muy caluroso, 10% de los trabajadores de producción de una empresa están ausentes del trabajo. Se van a seleccionar al azar 3 obreros para un estudio especial a profundidad sobre el ausentismo. a) b) c) d) e) f) ¿Cuál es la variable aleatoria en este problema ? ¿Tal variable es discreta o continua? ¿Por qué? ¿Cuál es la probabilidad de seleccionar al azar 3 nombres de trabajadores y descubrir que ninguno está ausente? Calcule la media y varianza. Represente la distribución mediante una gráfica. Encuentre la probabilidad acumulada y represéntela en un diagrama. Distribución Hipergeométrica Se utiliza de modelo cuando: •El número de pruebas o ensayos es fijo n •El resultado sólo puede tomar una de dos formas (éxito o fracaso) cada resultado es mutuamente excluyente. •La probabilidad de éxito no permanece constante de un ensayo a otro, es variable. •Los ensayos deben ser dependientes Esto ocurre cuendo los ensayos son sin reposición y en poblaciones finitas o pequeñas. La distribución probabilítica Hipergeométrica N i N − N i x n − x P( x) = N n Donde: N = Tamaño de la población Ni= Es el número total de elementos de la categoría éxito en la población n= Es el número de ensayos o tamaño de la muestra. x = Es el valor de la variable aleatoria discreta del número de éxitos Esperanza matemática : µ = E ( x) = np Varianza esperada N − n σ = V ( x) = np (1 − p) N − 1 2 p= Ni N Ejemplo: En Alke se acaba de recibir un embarque de 10 aparatos de TV. Poco después de recibirlos, el fabricante llamó para informar que por descuido habían enviado tres aparatos defectuosos. Se decidió probar dos de éstos. ¿Cuál es la probabilidad de que ninguno de los dos esté defectuoso?. Distribución Poisson También denominada ley de eventos improbables Se utiliza el modelo cuando: •Los problemas cumplen las caracteríticas de una distribución binomial con probabilidad de éxito “p”, pequeña (p< 0.05) y tamaño de muestra n grande (n>25). Aplicaciones: Distribución de errores en captura de datos Número de imperfecciones en piezas recientemente pintadas Fenómenos de espera La distribución probabilística Poisson P ( x) = λx e − λ x! Donde: µ= es la media (esperanza matemática) del número de ocurrencias (éxito) en un intervalo de tiempo dado. En situaciones binomiales µ=np y σ2=np x es la variable aleatoria discreta del número de éxitos e= 2.71828 (la base del logaritmo neperiano) Ejemplo Un productor de semillas híbridas tiene problemas con gusanos barrenadores del maíz. Una verificación aleatoria de 5.000 mazorcas reveló estos datos: muchas mazorcas no tenían gusanos. Algunas tenían uno, otras tenían dos, etc. La distribución del número de barrenadores se aproximó a una Poisson. El productor contó 3.500 gusanos en las 5.000 mazorcas. ¿Cuál es la probabilidad que una mazorca seleccionada al azar no contenga gusanos? Distribución Multinomial •Un experimento se comporata como una distribución multinomial cuando observa las siguientes características: •El número de pruebas del experiento es fijo •Los experimentos se clasifican en cataegorías (K) C1, C2, C3, ...Ck •La probabilidad de éxito para cada categoría permanece constante en cada prueba y se expresa como P1, P2, P3, ...Pk •Las pruebas son independientes, es decir el resultado de una prueba no afecta ni es afectado por el resultado de la prueba anterior o la siguiente La probabilidad del experimento se calcula por: n! f ( x1 , x2 ,..., xk ) = * p ( x1 ) x1 * p ( x2 ) x2 * ... * p ( xk ) xk x1!*x2 !*...xk ! f ( x1 , x2 ,..., xk ) = n! k ∏ xi ! i =1 k * ∏ p( xi ) xi i =1 Ejemplo: En una bolsa de mercado existen 7 cítricos: 3 naranjas, 2 limas y 2 toronjas. Un niño elige 3 cítricos con reposición. Determinar la probabilidad de que sean 2 toronjas y 1 naranja. Resolución: El número de pruebas es fijo = 3 Los resultados de las pruebas se clasifican en 3 categorías C1= toronjas, C2 naranjas, c3= limas La probabilidad de cada categoría es onstante en cada prueba y sus valores son:p1= 2/7 p2=3/7, p3=2/7 Las pruebas son independientes. 2 1 0 3! 2 3 2 f ( x1 = 2, x2 = 1, x3 = 0) = * * * = 0.105 2!*1!*0! 7 7 7 Distribución binomial negativa Un experimento aleatorio se comporta como una DBN cuando: El número de pruebas n es variable Los resultados se clasifican en dos categorias (éxito o fracaso) La probabilidad de éxito es constante en cada prueba Las pruebas son independientes. La probabilidad de los eventos se calcula n − 1 c n −c * p q b (n, c, p ) = c −1 Donde: n=número de pruebas c=número de éxitos p=probabilidad de éxito Por razones prácticas: n − 1 c n −c p q B (n.c. p) = ∑ c −1 * n x n− x B (n.c. p) = 1 − ∑ p q x * B* (n.c. p) = 1 − B( x − 1, n, p) Ejemplo: Los productores de duraznos en Cbba han detectado que el 10% de los duraznos están afectados por la mosca. Supongamos que un grupo de estudiantes van a un huerto de duraznos con el permniso del propietario y estan deseosos de que, eligiendo al azar los duraznos, puedan comer 20 duraznos buenos. ¿Cuál es la probabilidad de que tengan que probrar 25 o más duraznos (los afectados se descartan) Resolución: El número de pruebas es > 25, por tanto es variable Los resultados de la prueba se clasifican en éxito y fracaso Probabilidad de éxito, 90% constante en cada prueba Las pruebas son independientes Donde: c=x=número de éxitos=20 n= mayor que 25 (variable) p=0.90 probabilidad de éxito B* (25,20,0.9) = B(19,25,0.9) = 0.033 Distribución Uniforme Un experimento aleatorio es uniforme si puede terminar de n formas mutuamente excluyentes, todas igualmente probables. Las características son: El número de pruebas del experimento es fijo y es siempre 1. Los resultados del experimento se clasifican en categorías (K). C1 , C2 , . . . . , CK La probabilidad de éxito para cada categoría es la misma. Como sólo existe una prueba, no es necesario observar si la probabilidad se mantiene constante. P1 , P2 , . . . . , PK = Las categorías son mutuamente excluyentes. Como sólo existe una prueba, no es necesario clasificarla en independientes o dependientes. Distribución Uniforme La probabilidad de los eventos se calcula usando la siguiente expresión. f (x, k ) = 1 k para x = x1 , x 2 , K , x k Distribución Uniforme Otra forma de calcular la probabilidad es cuando se tienen los valores mínimo y máximo de la variable: . La variable entonces contiene (b-a+1) valores, cada uno con probabilidad: f ( x , b − a + 1) = 1 para b − a +1 x = a , K, b Con este formato, la media y la varianza esperada de una distribución uniforme discreta serán: a+b E(x ) = 2 (b − a + 1) 2 − 1 V ( x) = 12 Distribución Uniforme Ejemplos de experimentos aleatorios uniformes discretos son el comportamiento de un dado equilibrado en una sola tirada, ya que cada una de las seis caras tiene la misma probabilidad de presentarse que cualquier otra. La fórmula para el modelo probabilístico sería: 1 f ( x ,6 ) = 6 para x = 1, 2, 3, 4, 5, 6 Distribución Uniforme Ejemplo En un proceso de recubrimiento se toman varias mediciones del espesor, en centésimas de milímetro. Las mediciones están distribuidas de manera uniforme, con valores 15, 16, 17, 18 y 19. Para este proceso, calcule la media y varianza esperadas del espesor de recubrimiento y realice un gráfico de barras de la distribución. Distribución Uniforme Resolución El modelo probabilístico es uniforme discreto, ya que sólo se realiza una prueba, y tiene la siguiente función: f ( x,5) = 1 5 para x = 15, 16, 17, 18, 19 La media y varianza esperadas son: 19 + 15 E ( x) = = 17 2 S ( x ) = 1.4142 2 ( 19 − 15 + 1) − 1 V ( x) = =2 12 CV = 1.4142 *100 = 8.318% 17 Distribución Geométrica 2.7. Distribución geométrica Un experimento aleatorio se comporta como una geométrica cuando: El número de pruebas “n”, es variable. Los resultados se clasifican en 2 categorías (éxito o fracaso). La probabilidad de éxito es constante en cada prueba. Las pruebas son independientes. Distribución Geométrica Suponga que en una sucesión de pruebas o ensayos, queremos saber el número del ensayo en que ocurre el primer éxito, y que todas las suposiciones de la binomial, menos la primera se satisfacen; en otras palabras n no es fija. La probabilidad de obtener el primer éxito en el x-ésimo ensayo es proporcionada por: g( x , p) = p(1 − p) x −1 1 g ( x , p) = b (1, x , p) x 1 E( x ) = p para x = 1, 2,K si se transforma a una distribución binomial 1− p V( x ) = 2 p Distribución Geométrica Si la probabilidad de que un ladrón sea atrapado en un robo cualquiera es 0.20. a) ¿Cuál es la probabilidad de que lo capturen por primera vez en su cuarto robo? b) Determine la distribución c) Determine la media y varianza de la distribución. d) Realice un gráfico de barras. La distribución Normal 1 y= e σ 2π −( x−µ )2 2σ 2 −∞ ≤ x ≤ ∞ σ -∞ µ X ∞ Características de una distribución Normal •La curva tiene perfil de Campana •La Distribución probabilística Normal es simétrica con respecto a la media •La curva normal decrece uniformemente en ambas direcciones a partir del valor central •A una distancia de la media aritmética correspondiente a la desviación estándar, se encuentran sus puntos de inflexión Aproximación de la distribución Normal a la Binomial Se utiliza cuando np y nq son mayores a 5. Esto quiere decir que el número de ensayos es mayor a 20 z= ( x ± 0.5) − np npq Distribución uniforme continua Una variable aleatoria x con función de densidad de probabilidad con parámetros a y b: 1 f (x) = b − a 0 para a ≤ x ≤ b en los demás puntos La media y la varianza están dadas por las siguientes ecuaciones: a+b E(x ) = 2 (b − a ) 2 V( x ) = 12 Ejemplo La función de densidad de probabilidad del peso neto en libras de un paquete de alimento balanceado es f (x) = 2 , para 49.75 ≤ x ≤ 50.25 libras. a) Calcule la probabilidad de que un paquete pese más de 50 libras. b) ¿Cuánto alimento está contenido en el 90% de los paquetes? c) Calcule la media y la varianza del peso de los paquetes. d) Determine la función de distribución acumulada del peso de los paquetes. Distribución exponencial Si la distribución de Poisson describe las probabilidades del número de fallas por unidad de longitud, la exponencial da las probabilidades de la variable aleatoria que describe la distancia entre fallas. para la distancia entre ocurrencias Si la variable aleatoria x, es sucesivas de un proceso de Poisson con media , la función de densidad de probabilidad es: f ( x, λ) = λ e − λx 0≤x≤∞ La media y varianza esperadas son: 1 E( x ) = λ 1 V(x ) = 2 λ Ejemplo El promedio de llegada de camiones a una bodega para ser descargados es de 3 por hora. Encuentre las probabilidades de que el tiempo entre la llegada consecutiva de dos camiones sea: a) Menor de 5 minutos, b) Al menos de 45 minutos TEORÍA DE LA DECISIÓN Y LA DISTRIBUCIÓN NORMAL En el anterior curso de Estadística se vio ejemplos que trataban con un pequeño número de estados de la naturaleza y alternativas de solución. Pero ¿qué pasa si hay 50, 100 o miles de estados y/o alternativas? Es virtualmente imposible resolver el problema si se usa un árbol de decisiones o una tabla. Mostraremos que la teoría de la decisión puede ser extendida para manejar problemas de esas magnitudes. Teoría de la decisión y la Distribución Normal El análisis del punto de equilibrio, a menudo llamado análisis costo-volumen responde muchas preguntas comunes administrativas relacionadas al efecto de una decisión para los ingresos o costos en conjunto. ¿En qué punto se alcanza el equilibrio, o cuando los ingresos igualan a los costos? A un cierto volumen de ventas o nivel de demanda, ¿qué ingresos serán generados? Se verá los conceptos básicos de análisis del punto de equilibrio y se explorará cómo la distribución normal puede ser usada en el proceso de toma de decisiones. P.E.(q ) = Costos fijos CF = precio − cos to var iable unitario p − CVu Ejemplo: Una compañía elabora productos alimenticios y desea saber si introducirá o no, un nuevo producto de papilla para bebés sabor a frutas. Naturalmente, la compañía está familiarizada con los costos, demanda potencial, y los beneficios que se espera obtener si se comercializa esta papilla. La compañía identifica los siguientes costos relevantes: Costos fijo = 36,000 Bs., Costo variable unitario = 4 Bs. y el Precio de venta unitario = 10 Bs. De acuerdo a información muy preliminar se estima que la demanda promedio podría ser de 8000 unidades con una desviación estándar de 2885. ¿Cuál será el punto de equilibrio? ¿Cuál será la probabilidad de obtener ganancias? ¿Cuál la probabilidad de obtener pérdidas? Probabilidad de obtener pérdidas y ganancias: El Punto de equilibrio será: 24.51% 36000 P.E. = = 6000 10 − 4 75.49% 6000 8000 X P ( pérdida ) = P (demanda < P.E.) = 24.51% P(ganancia ) = P (demanda > P.E.) = 75.49% Uso del VME para la toma de decisiones Para tomar la decisión de introducir o no un nuevo producto en base la demanda probabilística es necesario obtener el Valor Monetario Esperado (VME) con el supuesto, de que la opción de no introducir el producto tiene un valor esperado de 0 Bs.. Si el VME de introducir el producto es mayor a 0 $, se recomendará su introducción. Para calcular el VME, se utilizará la demanda esperada, en la siguiente función de beneficio lineal: VME = ( PVu − CVu )(demanda media) − CF Ejemplo 10: Para el caso anterior calcular el VME VME = (10 − 4)(8000) − 36000 = 12000 En este punto la empresa tiene dos elecciones: 1) Proceder con la introducción del nuevo producto con una probabilidad del 75% de estar por encima del punto de equilibrio y lograr un Valor Monetario Esperado de 12000 $. 2) Realizar una investigación de mercado antes de hacer la decisión. Por lo que se debe hallar el Valor Esperado de la Información Perfecta. EL VEIP Y LA DISTRIBUCIÓN NORMAL Para calcular el Valor Esperado de Información Perfecta (VEIP) y la Pérdida de Oportunidad Esperada (POE) asociado a la introducción de un nuevo producto, se siguen los siguientes pasos: PASO 1. Determinar la función de costo de oportunidad. PASO 2. Usar la función de costo de oportunidad y la unidad normal integral de pérdida (dada en el anexo de tablas estadísticas) para encontrar la POE, que es el mismo que el VEIP. FUNCIÓN DE PÉRDIDA DE OPORTUNIDAD La función del costo de oportunidad describe la pérdida que se debería sufrir si se toma la decisión equivocada. A partir del punto de equilibrio (PE), si las ventas son mayores a éste, la decisión fue correcta y el costo de oportunidad será 0. Si las ventas, X, son inferiores al Punto de Equilibrio, la decisión fue incorrecta y el costo de oportunidad será positivo y expresado de la siguiente manera: K (P.E. − X) X ≤ P.E. Pérdida de opotunidad = X > P.E. 0 donde K es el costo por unidad cuando las ventas están por debajo del P.E. y X son las ventas en unidades. COSTO DE OPORTUNIDAD ESPERADO El segundo paso es encontrar el costo de oportunidad esperado. Es la suma de los costos de oportunidad multiplicados por las probabilidades adecuadas. Cuando se asume que hay infinitos (o un número muy grande) valores posibles de ventas que siguen una distribución normal, los cálculos son muchos más fáciles. Cuando la unidad normal integral de pérdida es usada, el POE puede ser calculado así: POE = K σ N (D ) donde: POE = Pérdida de Oportunidad Esperada K = Costo por unidad cuando las ventas son menores al P.E. σ= Desviación estándar de la distribución D= µ − P.E. σ N(D) = Valor de unidad normal integral de pérdida, dado un valor de D. Ejemplo: Para el caso de papillas para bebés el punto de equilibrio se determinó en 6000 unidades, el costo por unidad cuando las ventas están por debajo del punto de equilibrio es igual a 6. ¿Cuál es la función de Pérdida de Oportunidad? 6(6000 − X ) Pérdida de opotunidad = 0 X ≤ P.E. X > P.E. Ejemplo: Si se estimó que la demanda media para el producto de Papilla para bebés es de 8000 unidades con una desviación estándar de 2885. La compañía puede calcular el POE 8000 − 6000 como sigue: D= = 0.69 2885 De la tabla de unidad normal integral de pérdida, el N(D) es: N (0.69) = 0.1453 Por lo tanto: POE = (6)(2885)(0.1453) = 2515 .14 Puesto que el VEIP y la POE son equivalentes, el valor esperado de información perfecta es 2515.14 $. Esta es la máxima cantidad que la compañía debería estar dispuesta a pagar por un estudio de mercado. La relación entre la Función de Pérdida de Oportunidad y la Distribución Normal se muestra en la siguiente figura. Este gráfico muestra los costos de oportunidad y la normal con una media de 8000 unidades y una desviación estándar de 2885. A la derecha del punto de equilibrio la función de costo es 0. A la izquierda del P.E. la función de costo de oportunidad se incrementa con una pendiente de 6 $ por unidad. FUNCIÓN DE PÉRDIDA DE OPORTUNIDAD DE PAPILLAS PARA BEBÉS Costo ($) Función de costo m = -6 6000 8000 X (demanda)