Download VARIABLE ALEATORIA DISCRETA

Document related concepts
no text concepts found
Transcript
Estadística I
Variables Aleatorias Discretas
1
VARIABLE ALEATORIA DISCRETA
Muchas veces se desea resumir con un número el resultado de un experimento aleatorio. En muchos
de los ejemplos relativos a experimentos aleatorios que han sido considerados hasta ahora, el espacio
muestral es sólo una descripción de los posibles resultados. En algunos casos tales descripciones son
suficientes, pero en otros se hace útil asociar un número con cada resultado del espacio muestral. Es
así como se llega a la definición de variable aleatoria.
Una variable aleatoria X es una función que asigna un número real a cada resultado en el espacio
muestral  de un experimento aleatorio. El conjunto de los posibles valores de la variable aleatoria X
se denomina rango. Diremos que la variable aleatoria es discreta si su rango es finito (o infinito
contable).
A menudo el interés recae en la probabilidad de que una variable aleatoria X tome un valor
particular x, esto se denota P(X=x). La distribución de probabilidad de X será entonces la descripción
del conjunto de valores posibles de X (rango de X), junto con la probabilidad asociada con cada uno
de estos valores. La distribución de probabilidad de una variable aleatoria es a menudo el resumen
más útil de un experimento aleatorio.
Diremos que la función p(x)=P(X=x) que va del conjunto de valores posibles de la variable
aleatoria X al intervalo [0, 1] es la función distribución de probabilidad para X si y sólo si se
satisfacen las siguientes propiedades:
0  p(x)  1 para todo x
 p x   1
x
Se define la distribución acumulada F(x) para la variable aleatoria X como
F(x) = P(X  x) =
 p t 
tx
Prof. Fernando Salazar
Estadística I
Variables Aleatorias Discretas
2
Ejemplo 1
Experimento aleatorio: se lanza una moneda 3 veces
 = {ccc, ccs, csc, css, scc, scs, ssc, sss }
Sea X : # caras observadas
x
p(x)
0
1
1
8
2
3
3
8
3
1
8
8
La distribución anterior es una distribución de probabilidades para la variable aleatoria X, en efecto
0  p(x)  1 para todo x (x = 0, 1, 2 y 3) y además
p x  1. Para determinar la distribución
x
acumulada de probabilidad observe que

P(X  0) = P(X = 0) =
1
8
P(X  1) = P(X = 0) + P(X = 1) =
1 +3 = 1
8
2
8
P(X  2) = P(X = 0) + P(X = 1) + P(X = 2) =
1 +3 +3 =7
8
8
8
8
P(X  3) = P(X= 0) + P(X= 1) + P(X= 2) + P(X= 3) =
1 + 3 + 3 + 1 =1
8
8
8
8
Se tiene entonces,
x
F(x)
0
1
1
8
2
1
2
7
8
3
1
Si X es una variable aleatoria, y el experimento aleatorio que determina el valor de X se repite
muchas veces, entonces se obtiene una secuencia de valores para X. A partir de esta secuencia de
valores se puede identificar el valor promedio o valor esperado de la variable aleatoria X, que
denotamos EX , y se define en la forma siguiente:
EX =
 xp x
x
Prof. Fernando Salazar
Estadística I
Variables Aleatorias Discretas
3
Propiedades:
a) E(k)=k
b) E(kX)=kE(X)
c) E(XY)=E(X)E(Y)
d) E(g(X))=g(x)p(x)
e) Si X y Y son independientes entonces E(XY)=E(X)E(Y)=XY
Para el ejemplo dado,
EX =  xp x = 0 p0   1p1  2p2  3p3
x
1 3
3
1 12 3
= 0 .  1.  2.  3.  
8
8
8
8 8 2
A veces, el interés es determinar la variabilidad de la variable aleatoria. Definimos entonces la
varianza de la variable aleatoria X, denotada VX , ó σ2 mediante la siguiente ecuación:
V(X) = E[(X-E(X))2] y su forma reducida es:
 
2
2
donde, EX  =  x p x
VX = E X2  EX2
x
Para el ejemplo dado,
 
E X2 = 0 2 p0   12 p1  22 p2  32 p3
=
1 3
3
1 24
0 .  1.  4.  9.   3
8
8
8
8 8
2
3  12 9 3

Entonces, VX = 3    

4
4
 2
a)
b)
c)
d)
V(k)=0
V(kX)=k2V(X)
V(XY)=V(X)+V(Y) si X y Y son independientes
V(aX+bY)= a2V(X)+b2V(Y)+2abCov(XY)
donde Cov(XY) = E((X-X)(Y-Y)) = E(XY)-XY
La desviación estándar de la variable aleatoria X es la raíz cuadrada positiva de la varianza, es
decir, σ =
VX .
Prof. Fernando Salazar
Estadística I
Variables Aleatorias Discretas
4
DISTRIBUCIÓN BINOMIAL
Un ensayo Bernoulli es un experimento aleatorio que sólo admite dos posibles resultados,
denotados éxito y fracaso. La probabilidad de éxito se denota p.
Por lo tanto si denotamos el éxito por 1 y el fracaso por 0 se tiene:
P(1)= p P(0)=1-p=q
Además se cumple: E(X)= p V(X)=pq
Un proceso Bernoulli es un proceso en el cual se verifican las siguientes condiciones:
El experimento aleatorio se repite n veces en idénticas condiciones
Hay sólo dos posibles resultados en cada repetición del experimento, llamados arbitrariamente éxito y
fracaso
La probabilidad de éxito, denotada p, es la misma para cada repetición (permanece constante entre
repeticiones)
las n repeticiones del experimento aleatorio son independientes entre sí
Consideremos ahora la variable aleatoria X: # éxitos observados en n repeticiones. Suponga que se
quiere determinar la probabilidad de observar x éxitos en n repeticiones; esto es, se desea determinar
P(X = x). Como lo importante es observar x éxitos en n repeticiones, el orden de ocurrencia de los
mismos es irrelevante; así, para contar de cuántas formas pueden observarse x éxitos en n
repeticiones empleamos las combinaciones
 n
  . Por otro lado, como las n repeticiones del
 x
experimento son independientes entre sí y calcular P(X = x) equivale a calcular la probabilidad de una
intersección de eventos (en las que cada evento corresponde a un éxito o a un fracaso), tenemos que
x n x
la probabilidad de un punto muestral cualquiera asociado al experimento es p q
; en definitiva:
P(X = x) =
 n x n x
  p q
parax  0 , 1, 2, ..., n
x
 
n  n
 n x n x
Dado que 0    p q
 1 y    px qn  x  1, resulta que P(X = x) =
x
 x
x0  
 n x n x
  p q
parax  0 , 1, 2, ..., n determina una distribución de probabilidades denominada
x
 
distribución binomial.
Prof. Fernando Salazar
Estadística I
Variables Aleatorias Discretas
5
En resumen, se dice que la variable aleatoria X tiene distribución binomial si su función distribución
de probabilidad está dada por
 n  x n  x
  p q
si x  0 , 1 , ... , n
=


p x  x 

0
otros valores

Se puede demostrar que para una variable aleatoria con distribución binomial
EX = n.p
VX = n.p.q
DISTRIBUCIÓN HIPERGEOMETRICA:
Una variable aleatoria X tiene una distribución hipergeométrica si se toma una muestra sin
reemplazo de un conjunto de N elementos, de los cuales k son considerados de una categoría en
especial (aciertos) y los otros N-k son considerados de otra categoría (fallas) y se desea obtener x
aciertos de una muestra de n elementos ó ensayos. Se expresa de la siguiente formula:
 k  N  k 
 

x  n  x 

P( X  x) 
para x  0,1, 2,....., n
N
 
n
E ( x) 
nk
N
2 
N  n nk ( N  k )
.
N 1
N2
Esto también se puede extender para más de dos grupos.
Ejemplo:
Si existe tres grupos el primero con k1 elementos, el segundo grupo k2 y el tercero con k3 Si queremos
hallar la probabilidad de escoger x elementos del primer grupo, y elementos del segundo grupo y z
elementos del tercer grupo sin reemplazo; la probabilidad es la siguiente:
 k1  k2  k3 
   
x y z
P( X  x, Y  y, Z  z )     
 k1  k2  k3 


 x yz 
Prof. Fernando Salazar
Estadística I
Variables Aleatorias Discretas
6
Ejemplos:
.- En una urna hay 8 esferas rojas y 6 esferas blancas si se escoge una muestra de 5 esferas de las
cuales 3 son rojas cual es la probabilidad que eso ocurra.
.- Cual es la media y varianza del problema anterior.
.- Un producto industrial particular se embarca en lotes de 20. Un proyecto de muestreo elaborado
consiste tomar una muestra de cinco artículos de cada lote y el rechazo del lote se realizara si se
encuentra más de un artículo defectuoso. Si un lote contiene cuatro defectuoso. ¿Cuál es la
probabilidad de que se rechace el lote?
.- En una urna hay 8 esferas blancas, 6 esferas rojas y 4 esferas azules. ¿Cuál es la probabilidad de
escoger sin reemplazo 3 blancas 4 rojas y 2 azules?
DISTRIBUCIÓN POISSON
Los experimentos que dan valores numéricos de una variable aleatoria X que ocurre durante un
intervalo de tiempo dado o en una región específica se denominan experimentos Poisson. El
intervalo puede ser de cualquier longitud: un minuto, un día, una semana, un mes o incluso un año; y
la región específica podría ser: un segmento de línea, un área o quizás una pieza de material. Un
experimento Poisson se deriva de un proceso Binomial, el cual verifica las siguientes propiedades:
El número de resultados que ocurren en un intervalo o región es independiente del número de
resultados que ocurren en otro intervalo o región. (Esto determina una característica que se conoce
como falta de memoria)
La probabilidad de que ocurra un solo resultado durante un intervalo muy corto o una región pequeña
es proporcional a la longitud del intervalo o al tamaño de la región y no depende del número de
resultados que ocurren fuera de este intervalo o región.
la probabilidad de que ocurra más de un resultado en tal intervalo corto o que caiga en tal región
pequeña es insignificante.
La variable aleatoria X: # de resultados que ocurren durante un experimento Poisson se denomina
variable aleatoria Poisson y su distribución de probabilidades, dada por
e λ λ x
p x 
parax  0 ,1, ...... se denomina distribución Poisson; donde  es el número
x!
promedio de resultados por unidad de tiempo o región. Para una variable aleatoria con distribución
Poisson se tiene EX = VX = .
Prof. Fernando Salazar