Download Probabilidad y Estadística

Document related concepts
no text concepts found
Transcript
Probabilidad y Estadística
Distribuciones Teóricas de Probabilidad
Las funciones teóricas de probabilidad corresponden a modelos
que permiten expresar teorías sobre el comportamiento ideal de
una variable en la realidad.
Se utilizan para:
Expresar lo que puede esperarse de un universo
Como fuente de referencia
Cuando las distribuciones observadas son difíciles de formalizar
Sirve para realizar inferencias y elaborar predicciones sobre el
comportamiento de una variable.
Las funciones teóricas de probabilidad correspondientes a
variables discretas:
•Binomial
•Hipergeométrica
•Poisson
•Multinomial
•Uniforme Discreta
•Geométrica
•Binomial Negativa
Si la variable aleatoria es continua
La Normal
Uniforme Continua
Exponencial
DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
La determinación de un modelo teórico discreto de
probabilidades para aplicarlo a un caso observado, se realiza
tomando en cuenta las siguientes características.
•La naturaleza del número de pruebas del experimento ( fijo o
variable)
•La naturaleza de los resultados del experimento (dicotómico o
no)
•El carácter de la probabilidad de cada prueba (Constante o
variable)
•La determinación del carácter del experimento( Sucesos
dependientes o no)
Distribución Binomial
Se utiliza de modelo cuando:
•El número de pruebas o ensayos es fijo n
•El resultado sólo puede tomar una de dos formas (éxito o
fracaso) cada resultado es mutuamente excluyente.
•La probabilidad de éxito “p”, permanece constante de un
ensayo a otro y lo mismo sucede con el fracaso “q” tal que p +
q = 1.
•Los ensayos son independientes, lo que significa que el
resultado de un ensayo no afecta al resultado de algún otro.Esta
condición puede asegurarse mediante un muestreo con
reposición en poblaciones finitas o el muestreo de poblaciones
infinitas o muy grandes
La distribución probabilística binomial
 n  x n− x
P( x) =   p q
 x
Donde:
Media esperada:
µ = E ( x) = np
n
n!
  =
 x  (n − x)! x!
Varianza esperada
Simbología
σ 2 = V ( x) = npq
b(n,p,x)
Ejemplo:
En un día veraniego muy caluroso, 10% de los trabajadores de producción
de una empresa están ausentes del trabajo. Se van a seleccionar al azar 3
obreros para un estudio especial a profundidad sobre el ausentismo.
a)
b)
c)
d)
e)
f)
¿Cuál es la variable aleatoria en este problema ?
¿Tal variable es discreta o continua? ¿Por qué?
¿Cuál es la probabilidad de seleccionar al azar 3 nombres de
trabajadores y descubrir que ninguno está ausente?
Calcule la media y varianza.
Represente la distribución mediante una gráfica.
Encuentre la probabilidad acumulada y represéntela en un
diagrama.
Distribución Hipergeométrica
Se utiliza de modelo cuando:
•El número de pruebas o ensayos es fijo n
•El resultado sólo puede tomar una de dos formas (éxito o
fracaso) cada resultado es mutuamente excluyente.
•La probabilidad de éxito no permanece constante de un ensayo
a otro, es variable.
•Los ensayos deben ser dependientes Esto ocurre cuendo los
ensayos son sin reposición y en poblaciones finitas o pequeñas.
La distribución probabilítica Hipergeométrica
 N i  N − N i 
  

x
n
−
x

P( x) =   
N 
n 
 
Donde:
N = Tamaño de la población
Ni= Es el número total de elementos de la categoría éxito en la población
n= Es el número de ensayos o tamaño de la muestra.
x = Es el valor de la variable aleatoria discreta del número de éxitos
Esperanza matemática
:
µ = E ( x) = np
Varianza esperada
 N − n
σ = V ( x) = np (1 − p) 
 N − 1 
2
p=
Ni
N
Ejemplo:
En Alke se acaba de recibir un embarque de 10 aparatos de TV. Poco
después de recibirlos, el fabricante llamó para informar que por descuido
habían enviado tres aparatos defectuosos. Se decidió probar dos de éstos.
¿Cuál es la probabilidad de que ninguno de los dos esté defectuoso?.
Distribución Poisson
También denominada ley de eventos improbables
Se utiliza el modelo cuando:
•Los problemas cumplen las caracteríticas de una distribución
binomial con probabilidad de éxito “p”, pequeña (p< 0.05) y
tamaño de muestra n grande (n>25).
Aplicaciones:
Distribución de errores en captura de datos
Número de imperfecciones en piezas recientemente pintadas
Fenómenos de espera
La distribución probabilística Poisson
P ( x) =
λx e − λ
x!
Donde:
µ= es la media (esperanza matemática) del número de
ocurrencias (éxito) en un intervalo de tiempo dado.
En situaciones binomiales µ=np y σ2=np
x es la variable aleatoria discreta del número de éxitos
e= 2.71828 (la base del logaritmo neperiano)
Ejemplo
Un productor de semillas híbridas tiene problemas con gusanos barrenadores
del maíz. Una verificación aleatoria de 5.000 mazorcas reveló estos datos:
muchas mazorcas no tenían gusanos. Algunas tenían uno, otras tenían dos,
etc. La distribución del número de barrenadores se aproximó a una Poisson.
El productor contó 3.500 gusanos en las 5.000 mazorcas. ¿Cuál es la
probabilidad que una mazorca seleccionada al azar no contenga gusanos?
Distribución Multinomial
•Un experimento se comporata como una distribución
multinomial cuando observa las siguientes características:
•El número de pruebas del experiento es fijo
•Los experimentos se clasifican en cataegorías (K)
C1, C2, C3, ...Ck
•La probabilidad de éxito para cada categoría permanece
constante en cada prueba y se expresa como
P1, P2, P3, ...Pk
•Las pruebas son independientes, es decir el resultado de una
prueba no afecta ni es afectado por el resultado de la prueba
anterior o la siguiente
La probabilidad del experimento se calcula por:
n!
f ( x1 , x2 ,..., xk ) =
* p ( x1 ) x1 * p ( x2 ) x2 * ... * p ( xk ) xk
x1!*x2 !*...xk !
f ( x1 , x2 ,..., xk ) =
n!
k
∏ xi !
i =1
k
* ∏ p( xi ) xi
i =1
Ejemplo: En una bolsa de mercado existen 7 cítricos: 3 naranjas,
2 limas y 2 toronjas. Un niño elige 3 cítricos con reposición.
Determinar la probabilidad de que sean 2 toronjas y 1 naranja.
Resolución:
El número de pruebas es fijo = 3
Los resultados de las pruebas se clasifican en 3 categorías
C1= toronjas, C2 naranjas, c3= limas
La probabilidad de cada categoría es onstante en cada prueba y
sus valores son:p1= 2/7 p2=3/7, p3=2/7
Las pruebas son independientes.
2
1
0
3!
2 3 2
f ( x1 = 2, x2 = 1, x3 = 0) =
*   *   *   = 0.105
2!*1!*0!  7   7   7 
Distribución binomial negativa
Un experimento aleatorio se comporta como una DBN cuando:
El número de pruebas n es variable
Los resultados se clasifican en dos categorias (éxito o fracaso)
La probabilidad de éxito es constante en cada prueba
Las pruebas son independientes.
La probabilidad de los eventos se calcula
 n − 1 c n −c
*
 p q
b (n, c, p ) = 
 c −1
Donde:
n=número de pruebas
c=número de éxitos
p=probabilidad de éxito
Por razones prácticas:
 n − 1 c n −c
 p q
B (n.c. p) = ∑ 
 c −1
*
 n  x n− x
B (n.c. p) = 1 − ∑   p q
 x
*
B* (n.c. p) = 1 − B( x − 1, n, p)
Ejemplo: Los productores de duraznos en Cbba han detectado
que el 10% de los duraznos están afectados por la mosca.
Supongamos que un grupo de estudiantes van a un huerto de
duraznos con el permniso del propietario y estan deseosos de
que, eligiendo al azar los duraznos, puedan comer 20 duraznos
buenos. ¿Cuál es la probabilidad de que tengan que probrar 25 o
más duraznos (los afectados se descartan)
Resolución:
El número de pruebas es > 25, por tanto es variable
Los resultados de la prueba se clasifican en éxito y fracaso
Probabilidad de éxito, 90% constante en cada prueba
Las pruebas son independientes
Donde:
c=x=número de éxitos=20
n= mayor que 25 (variable)
p=0.90 probabilidad de éxito
B* (25,20,0.9) = B(19,25,0.9) = 0.033
Distribución Uniforme
Un experimento aleatorio es uniforme si puede terminar de n formas
mutuamente excluyentes, todas igualmente probables. Las
características son:
El número de pruebas del experimento es fijo y es siempre 1.
Los resultados del experimento se clasifican en categorías (K).
C1 , C2 , . . . . , CK
La probabilidad de éxito para cada categoría es la misma. Como sólo
existe una prueba, no es necesario observar si la probabilidad se
mantiene constante.
P1 , P2 , . . . . , PK =
Las categorías son mutuamente excluyentes. Como sólo existe una
prueba, no es necesario clasificarla en independientes o dependientes.
Distribución Uniforme
La probabilidad de los eventos se calcula usando la siguiente
expresión.
f (x, k ) =
1
k
para
x = x1 , x 2 , K , x k
Distribución Uniforme
Otra forma de calcular la probabilidad es cuando se tienen los
valores mínimo y máximo de la variable: . La variable entonces
contiene (b-a+1) valores, cada uno con probabilidad:
f ( x , b − a + 1) =
1
para
b − a +1
x = a , K, b
Con este formato, la media y la varianza esperada de una
distribución uniforme discreta serán:
a+b
E(x ) =
2
(b − a + 1) 2 − 1
V ( x) =
12
Distribución Uniforme
Ejemplos de experimentos aleatorios uniformes
discretos son el comportamiento de un dado equilibrado
en una sola tirada, ya que cada una de las seis caras tiene
la misma probabilidad de presentarse que cualquier otra.
La fórmula para el modelo probabilístico sería:
1
f ( x ,6 ) =
6
para
x = 1, 2, 3, 4, 5, 6
Distribución Uniforme
Ejemplo
En un proceso de recubrimiento se toman varias mediciones del
espesor, en centésimas de milímetro. Las mediciones están
distribuidas de manera uniforme, con valores 15, 16, 17, 18 y 19.
Para este proceso, calcule la media y varianza esperadas del
espesor de recubrimiento y realice un gráfico de barras de la
distribución.
Distribución Uniforme
Resolución
El modelo probabilístico es uniforme discreto, ya que sólo
se realiza una prueba, y tiene la siguiente función:
f ( x,5) =
1
5
para
x = 15, 16, 17, 18, 19
La media y varianza esperadas son:
19 + 15
E ( x) =
= 17
2
S ( x ) = 1.4142
2
(
19 − 15 + 1) − 1
V ( x) =
=2
12
CV =
1.4142
*100 = 8.318%
17
Distribución Geométrica
2.7. Distribución geométrica
Un experimento aleatorio se comporta como
una geométrica cuando:
El número de pruebas “n”, es variable.
Los resultados se clasifican en 2 categorías
(éxito o fracaso).
La probabilidad de éxito es constante en cada
prueba.
Las pruebas son independientes.
Distribución Geométrica
Suponga que en una sucesión de pruebas o ensayos, queremos
saber el número del ensayo en que ocurre el primer éxito, y que
todas las suposiciones de la binomial, menos la primera se
satisfacen; en otras palabras n no es fija.
La probabilidad de obtener el primer éxito en el x-ésimo ensayo
es proporcionada por:
g( x , p) = p(1 − p) x −1
1
g ( x , p) = b (1, x , p)
x
1
E( x ) =
p
para
x = 1, 2,K
si se transforma a una
distribución binomial
1− p
V( x ) = 2
p
Distribución Geométrica
Si la probabilidad de que un ladrón sea atrapado en un robo
cualquiera es 0.20.
a) ¿Cuál es la probabilidad de que lo capturen por primera vez
en su cuarto robo?
b) Determine la distribución
c) Determine la media y varianza de la distribución.
d) Realice un gráfico de barras.
La distribución Normal
1
y=
e
σ 2π
−( x−µ )2
2σ 2
−∞ ≤ x ≤ ∞
σ
-∞
µ
X
∞
Características de una distribución Normal
•La curva tiene perfil de Campana
•La Distribución probabilística Normal es simétrica con
respecto a la media
•La curva normal decrece uniformemente en ambas
direcciones a partir del valor central
•A una distancia de la media aritmética correspondiente a la
desviación estándar, se encuentran sus puntos de inflexión
Aproximación de la distribución Normal a la Binomial
Se utiliza cuando np y nq son mayores a 5. Esto quiere decir que
el número de ensayos es mayor a 20
z=
( x ± 0.5) − np
npq
Distribución uniforme continua
Una variable aleatoria x con función de densidad de
probabilidad con parámetros a y b:
 1

f (x) =  b − a
0
para a ≤ x ≤ b
en los demás puntos
La media y la varianza están dadas por las siguientes ecuaciones:
a+b
E(x ) =
2
(b − a ) 2
V( x ) =
12
Ejemplo
La función de densidad de probabilidad del peso neto en libras de
un paquete de alimento balanceado es
f (x) = 2
, para
49.75 ≤ x ≤ 50.25
libras.
a) Calcule la probabilidad de que un paquete pese más de 50 libras.
b) ¿Cuánto alimento está contenido en el 90% de los paquetes?
c) Calcule la media y la varianza del peso de los paquetes.
d) Determine la función de distribución acumulada del peso de los
paquetes.
Distribución exponencial
Si la distribución de Poisson describe las probabilidades del
número de fallas por unidad de longitud, la exponencial da
las probabilidades de la variable aleatoria que describe la
distancia entre fallas.
para la distancia entre ocurrencias
Si la variable aleatoria x, es
sucesivas de un proceso de Poisson con media , la función
de densidad de probabilidad es:
f ( x, λ) = λ e
− λx
0≤x≤∞
La media y varianza esperadas son:
1
E( x ) =
λ
1
V(x ) = 2
λ
Ejemplo
El promedio de llegada de camiones a una bodega
para ser descargados es de 3 por hora. Encuentre las
probabilidades de que el tiempo entre la llegada
consecutiva de dos camiones sea: a) Menor de 5
minutos, b) Al menos de 45 minutos
TEORÍA DE LA DECISIÓN Y LA DISTRIBUCIÓN NORMAL
En el anterior curso de Estadística se vio ejemplos que
trataban con un pequeño número de estados de la
naturaleza y alternativas de solución. Pero ¿qué pasa si
hay 50, 100 o miles de estados y/o alternativas? Es
virtualmente imposible resolver el problema si se usa un
árbol de decisiones o una tabla. Mostraremos que la
teoría de la decisión puede ser extendida para manejar
problemas de esas magnitudes.
Teoría de la decisión y la Distribución Normal
El análisis del punto de equilibrio, a menudo llamado análisis costo-volumen
responde muchas preguntas comunes administrativas relacionadas al efecto de
una decisión para los ingresos o costos en conjunto.
¿En qué punto se alcanza el equilibrio, o cuando los ingresos igualan a los
costos?
A un cierto volumen de ventas o nivel de demanda, ¿qué ingresos serán
generados?
Se verá los conceptos básicos de análisis del punto de equilibrio y se explorará
cómo la distribución normal puede ser usada en el proceso de toma de
decisiones.
P.E.(q ) =
Costos fijos
CF
=
precio − cos to var iable unitario p − CVu
Ejemplo:
Una compañía elabora productos alimenticios y desea saber si introducirá o no,
un nuevo producto de papilla para bebés sabor a frutas. Naturalmente, la
compañía está familiarizada con los costos, demanda potencial, y los beneficios
que se espera obtener si se comercializa esta papilla. La compañía identifica los
siguientes costos relevantes: Costos fijo = 36,000 Bs., Costo variable unitario = 4
Bs. y el Precio de venta unitario = 10 Bs. De acuerdo a información muy
preliminar se estima que la demanda promedio podría ser de 8000 unidades con
una desviación estándar de 2885.
¿Cuál será el punto de equilibrio? ¿Cuál será la probabilidad de obtener
ganancias? ¿Cuál la probabilidad de obtener pérdidas?
Probabilidad de obtener pérdidas y ganancias:
El Punto de equilibrio será:
24.51%
36000
P.E. =
= 6000
10 − 4
75.49%
6000
8000
X
P ( pérdida ) = P (demanda < P.E.) = 24.51%
P(ganancia ) = P (demanda > P.E.) = 75.49%
Uso del VME para la toma de decisiones
Para tomar la decisión de introducir o no un nuevo producto en base la
demanda probabilística es necesario obtener el Valor Monetario Esperado
(VME) con el supuesto, de que la opción de no introducir el producto
tiene un valor esperado de 0 Bs.. Si el VME de introducir el producto es
mayor a 0 $, se recomendará su introducción.
Para calcular el VME, se utilizará la demanda esperada, en la siguiente
función de beneficio lineal:
VME = ( PVu − CVu )(demanda media) − CF
Ejemplo 10: Para el caso anterior calcular el VME
VME = (10 − 4)(8000) − 36000 = 12000
En este punto la empresa tiene dos elecciones:
1) Proceder con la introducción del nuevo producto con una probabilidad
del 75% de estar por encima del punto de equilibrio y lograr un Valor
Monetario Esperado de 12000 $.
2) Realizar una investigación de mercado antes de hacer la decisión. Por
lo que se debe hallar el Valor Esperado de la Información Perfecta.
EL VEIP Y LA DISTRIBUCIÓN NORMAL
Para calcular el Valor Esperado de Información Perfecta (VEIP) y la
Pérdida de Oportunidad Esperada (POE) asociado a la introducción de un
nuevo producto, se siguen los siguientes pasos:
PASO 1. Determinar la función de costo de oportunidad.
PASO 2. Usar la función de costo de oportunidad y la unidad normal
integral de pérdida (dada en el anexo de tablas estadísticas) para encontrar
la POE, que es el mismo que el VEIP.
FUNCIÓN DE PÉRDIDA DE OPORTUNIDAD
La función del costo de oportunidad describe la pérdida que se debería
sufrir si se toma la decisión equivocada. A partir del punto de
equilibrio (PE), si las ventas son mayores a éste, la decisión fue
correcta y el costo de oportunidad será 0. Si las ventas, X, son
inferiores al Punto de Equilibrio, la decisión fue incorrecta y el costo
de oportunidad será positivo y expresado de la siguiente manera:
K (P.E. − X) X ≤ P.E.
Pérdida de opotunidad = 
X > P.E.
0
donde K es el costo por unidad cuando las ventas están por debajo del P.E. y
X son las ventas en unidades.
COSTO DE OPORTUNIDAD ESPERADO
El segundo paso es encontrar el costo de oportunidad esperado. Es la suma de los
costos de oportunidad multiplicados por las probabilidades adecuadas. Cuando se
asume que hay infinitos (o un número muy grande) valores posibles de ventas que
siguen una distribución normal, los cálculos son muchos más fáciles.
Cuando la unidad normal integral de pérdida es usada, el POE puede ser calculado así:
POE = K σ N (D )
donde:
POE = Pérdida de Oportunidad Esperada
K = Costo por unidad cuando las ventas son menores al P.E.
σ= Desviación estándar de la distribución
D=
µ − P.E.
σ
N(D) = Valor de unidad normal integral de pérdida, dado un valor de D.
Ejemplo:
Para el caso de papillas para bebés el punto de equilibrio se determinó en 6000
unidades, el costo por unidad cuando las ventas están por debajo del punto de
equilibrio es igual a 6. ¿Cuál es la función de Pérdida de Oportunidad?
6(6000 − X )
Pérdida de opotunidad = 
0
X ≤ P.E.
X > P.E.
Ejemplo:
Si se estimó que la demanda media para el producto de Papilla para bebés es de 8000
unidades con una desviación estándar de 2885. La compañía puede calcular el POE
8000 − 6000
como sigue:
D=
= 0.69
2885
De la tabla de unidad normal integral de pérdida, el N(D) es:
N (0.69) = 0.1453
Por lo tanto:
POE = (6)(2885)(0.1453) = 2515 .14
Puesto que el VEIP y la POE son equivalentes, el valor esperado de información
perfecta es 2515.14 $. Esta es la máxima cantidad que la compañía debería estar
dispuesta a pagar por un estudio de mercado.
La relación entre la Función de Pérdida de Oportunidad y la Distribución Normal se
muestra en la siguiente figura. Este gráfico muestra los costos de oportunidad y la
normal con una media de 8000 unidades y una desviación estándar de 2885. A la
derecha del punto de equilibrio la función de costo es 0. A la izquierda del P.E. la
función de costo de oportunidad se incrementa con una pendiente de 6 $ por unidad.
FUNCIÓN DE PÉRDIDA DE OPORTUNIDAD DE PAPILLAS PARA BEBÉS
Costo ($)
Función de costo
m = -6
6000
8000
X (demanda)