Download La Variable Aleatoria Archivo

Document related concepts
no text concepts found
Transcript
05. VARIABLE ALEATORIA
En gran cantidad de experimentos aleatorios es necesario cuantificar los resultados, es
decir, asignar a cada resultado del experimento un número, con el fin de poder
realizar un estudio matemático. Ejemplos. Consideremos el experimento aleatorio que
consiste en lanzar tres monedas, supongamos que a cada elemento de su espacio
muestral E=(CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS) le asignamos un número
real, el correspondiente al número de caras.
Esta correspondencia que acabamos de construir es una función del espacio muestral
E en el conjunto de los números reales R. A esta función la llamaremos Variable
Aleatoria y la denotaremos por X.
Supongamos el experimento aleatorio que consiste en lanzar dos dados, podemos
asignar a cada resultado la suma de los puntos aparecidos en cada dado (discreta).
Consideremos el experimento que consiste en elegir al azar 500 personas y medir su
estatura. La ley que asocia a cada persona con su talla es una variable aleatoria
(continua).
Variable Aleatoria. Se dice que hemos definido una variable aleatoria para un
experimento aleatorio cuando hemos asociado un valor numérico a cada resultado del
experimento. Sea E el Espacio muestral asociado a un experimento. Se llama
variable aleatoria a toda aplicación del espacio muestral E en el conjunto de los
números reales (es decir, asocia a cada elemento de E un número real). Se utilizan
letras mayúsculas X, Y,... para designar variables aleatorias, y las respectivas
minúsculas (x, y, ...) para designar valores concretos de las mismas.
Si un experimento con espacio muestral E, tiene asociada la variable aleatoria X, es
natural que se planteen preguntas como: ¿Cuál es la probabilidad de que X tome un
determinado valor?, esto nos lleva a establecer, por convenio, la siguiente notación,
-
(X=x) representa el suceso "la Variable Aleatoria X toma el valor x", y P(X=x)
representa la probabilidad de dicho suceso.
1
-
(X<x) representa el suceso "la variable aleatoria X toma un valor menor a x", y
P(X<x) representa la probabilidad de que la Variable Aleatoria X tome un valor
menor a x.
-
(X ) representa el suceso "la variable aleatoria X toma un valor menor o igual
a x”, y P(X ) representa la probabilidad de que la Variable Aleatoria X tome
un valor menor o igual a x.
Normalmente, los resultados posibles (Espacio muestral E) de un experimento
aleatorio no son valores numéricos. Por ejemplo, si el experimento consiste en lanzar
de modo ordenado tres monedas al aire, para observar el número de caras (C) y Sellos
(S) que se obtienen, el espacio muestral asociado a dicho experimento aleatorio sería:
E=(CCC,CCS,CSC,SCC,SCS,SSC,CSS,SSS)
En estadística resulta más fácil utilizar valores numéricos en lugar de trabajar
directamente con los elementos de un espacio muestral como el anterior. Así
preferimos identificar los sucesos (CSS,SCS,SSC) con el valor numérico 1 que
representa el número de caras obtenidas al realizar el experimento. De este modo
aparece el concepto de variable aleatoria unidimensional como el de toda función
X:E 
e  X ( e)  x e
que atribuye un único número real xe, a cada suceso elemental e, del espacio muestral
E.
Por ejemplo, en el ejemplo anterior, se define la variable aleatoria: X=Número de
caras del siguiente modo: X(CCC)=3; X(CCS,CSC,SCC)=2; y X(SSC,CSS,SCS)=1,
y finalmente X(SSS)=0, puesto que estamos hablando de caras
-
La variable X no recibe el calificativo de aleatoria por el hecho de que atribuya de
modo imprevisible un valor cualquiera a un elemento (e está incluido en E) ya
que este valor está definido de forma precisa (determinística). Lo que es aleatorio
en realidad, es que al hacer el experimento, no sabemos qué elemento de E puede
ocurrir.
-
La composición de una función real con una variable es también variable
aleatoria, pues está definida sobre E y a cada elemento suyo le asocia un valor
real.
X:E 
E
h (X)  h
ó
h : 
x  h (X(e))
2
En función de los valores que tome la variable, esta puede ser clasificada en discreta
o continua del siguiente modo que es Discreta cuando sólo puede tomar un número
finito o infinito numerable de valores, por ejemplo, el conjunto de los números
naturales; y es Continua cuando puede tomar un número infinito no numerable de
valores, por ejemplo, el conjunto de los número reales. En un caso se habla de
elementos contables y en el otro de elementos medibles
Si sobre los elementos de E existe una distribución de probabilidad, esta se transmite
a los valores que toma la variable X. Es decir, toda la variable aleatoria conserva la
estructura probabilística del experimento aleatorio que describe, en el sentido de que
si P es la función de probabilidad definida sobre el espacio muestral E, ésta induce
otra función P` definida sobre el conjunto de los reales, de forma que conserva los
valores de las probabilidades,
P (X  x )  Pe  E : X(E)  x 
ó
P X  (a , b)   Pe  E : X(e)  (a , b) 
Variable Aleatoria Discreta. Dada una Variable Aleatoria Discreta X, su función de
probabilidad f, se define de modo que f(xi) es la probabilidad de que X tome ese
valor. Si xi no es uno de los valores que puede tomar X, entonces f(xi)=0. La
representación gráfica de la función de probabilidad se realiza mediante un diagrama
de barras análogo al de distribución de frecuencias relativas para variables discretas.
Ejemplo, si retomamos el caso del lanzamiento de 3 monedas de forma que cada una
de ellas tenga probabilidad 1/2 de dar como resultado cara o sello, se tiene que,
f (3)  P(X  3)  P(CCC)  1 / 2 *1 / 2 * / 2  1 / 8
f (2)  P(X  2)  P(CCS, CSC, SCC)  1 / 8  1 / 8  1 / 8  3 / 8
f (1)  P(X  1)  P(SSC, SCS, CSS)  1 / 8  1 / 8  1 / 8  3 / 8
f (0)  P(X  0)  P(SSS)  1 / 2 *1 / 2 *1 / 2  1 / 8
Obsérvese que X está definido sobre el espacio muestral de sucesos E, mientras que f
lo está sobre el espacio de números reales .Las propiedades de la función de
probabilidad de Variable Aleatoria se deducen de forma inmediata de los axiomas de
probabilidad,
Si x1,…,xn son todos los valores admisibles de la variable aleatoria X, entonces, la
suma de probabilidades de todos los valores es UNO (1):
k
k
i 1
i 1
 f ( X i )   P( X  x i )  1
e igualmente todos estos valores deben ser positivos.
3
Otro concepto importante es el de función de distribución de una variable aleatoria
discreta, F, que se define de modo que si x pertenece al conjunto de los valores reales,
F(xi) es igual a la probabilidad de que X tome un valor inferior o igual a xi:
F(xi)=P(X≤xi)
Esta función se representa gráficamente del mismo modo que la distribución de
frecuencias relativas acumuladas. Volviendo al ejemplo de las tres monedas, se tiene
que
F(3)  P(X  3)  f (0)  f (1)  f (2)  f (3)  1 / 8  3 / 8  3 / 8  1 / 8  1
F(2)  P(X  2)  f (0)  f (1)  f (2)  1 / 8  3 / 8  3 / 8  7 / 8
F(1)  P(X  1)  F(0)  f (1)  1 / 8  3 / 8  4 / 8
F(0)  P(X  0)  f (0)  1 / 8
Gráficamente,
Variables aleatorias discretas
Problema. Lanzamos dos dados al aire. Nos interesa encontrar probabilidades tal
como la probabilidad de que la suma de los puntos en los dados es menor que 8. Si
asumimos que todos los resultados observados al tirar dos dados son equiprobables
entonces el espacio muestral del experimento, con treinta y seis posibles resultados
es:
1 1, 1 1, 2 1, 3 1, 4 1, 5 1, 6 1
2 2, 1 2, 2 2, 3 2, 4 2, 5 2, 6 2
3 3, 1 3, 2 3, 3 3, 4 3, 5 3, 6 3
4 4, 1 4, 2 4, 3 4, 4 4, 5 4, 6 4
5 5, 1 5, 2 5, 3 5, 4 5, 5 5, 6 5
4
Como nos interesa la suma de los puntos observados, si obtenemos el resultado (3, 5)
le asignamos el valor 8, correspondiente a la suma de 3 y 5. Podemos calcular la
probabilidad de que la suma sea igual a 8, contando todos los resultados donde la
suma es ocho. El evento de que la suma es ocho contiene 5 resultados: {(2,6), (3,5),
(4,4), (5, 3), (6,2)}; por lo tanto la probabilidad deseada es 5/36. Podemos repetir este
proceso con cada uno de los resultados para obtener la siguiente tabla:
Resultado
2
3
4
5
6
7
8
9
10
11
12
Probabilidad 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Hemos encontrado la distribución de probabilidad de los valores posibles de la suma
al tirar dos dados. En general, si S es un espacio muestral con una medida de
probabilidad P, definimos una variable aleatoria como una función que asigna un
número real a cada uno de los elementos de S. Es decir X es una función cuyo
dominio es el espacio muestral S y su codominio es el conjunto de números reales
Interpretamos, por ejemplo X = 8 como el evento de que se observó el resultado 8 al
tirar los dos dados, es decir el evento { (2,6), (3,5), (4,4), (5, 3), (6,2)} ocurrió.
También asignamos a X = 8 la probabilidad de ese evento. Así vemos que P( X = 8 )
= P({ (2,6), (3,5), (4,4), (5, 3), (6,2)}) = 5/36. Nota que a pesar de que X es una
función, usualmente no se escribe el argumento de la función, es decir, si s es un
elemento del espacio muestral S, en vez de escribir X(s), sencillamente escribimos X.
Es usual denotar las variables aleatorias por letras mayúsculas y los valores que puede
asumir por letras minúsculas.
Par Ordenado. Sea un conjunto {a,b} constituido por los elementos a y b, el {a , b}
el conjunto de todos los subconjuntos del conjunto {a,b}, que consta de los
elementos  , {a}, {b}, {a,b}. Se llama par ordenado  a , b al subconjunto
{{a},{a,b}} de {a , b}
Si A y B son dos conjuntos, el Producto Cartesiano, A  B , es el conjunto de todos
los posibles pares ordenados  a , b formados con el primer elemento a que pertenece
a A y un segundo elemento b que pertenece a B, esto es, A  B  a, b a  A, b  B
Una Relación R entre los conjuntos A y B es un subconjunto de A  B
Se llama Dominio de una Relación R entre A y B, y se designa por domR, al
conjunto de los elementos a  A tales que para algún b  B sea  a , b  R , esto es,
en símbolos, domR  a  A para a lg un b  B,a, b  R,
o sea, el dominio de una relación es el conjunto de las primeras coordenadas de los
pares ordenados de R
5
Se denomina Rango de una relación R, rgR, o recorrido de R, recR, al conjunto de
aquellos elementos b B , tales que para algún b  B , sea  a , b  R , o sea, en otras
palabras, rgR  b  B para a lg un a  A,a, b  R
Una Función f de A a B, lo que quiere decir, una función f cuyo dominio esta en A y
cuyo rango está en B, es una relación entre A y B con estas condiciones,
domf  A, a, b1   f , y a, b 2   f , debe ser b1=b2
Variable Aleatoria. Sea  un conjunto fundamental de probabilidades y sea  el
sigma – anillo de sucesos sobre  . La variable aleatoria X es una función cuyo
dominio es  y cuyo rango es un conjunto no vacío de números reales, con la
condición de que para cualquier número real x, el conjunto de sucesos elementales 
para los que X()  x sea un suceso, esto es, un elemento de  . O sea,
   X()  x
Sigma – Espacio. (,, P) ,  es el conjunto de los subconjuntos de 
Notación, Desde este punto, se trabajara con la notación X  x  en vez de
   X()  x y X S en vez de    X()  S,
lo que permitirá ajustarnos mas a lo normal de a literatura estadística y normal de
otros textos.
Si X es una función cualquiera con dominio  , cuyo rango es el conjunto no vacío
de números reales, entonces, se verifica que,

 [X  x  2  n ]  [X  x ]
n 1
para cualquier número real x
Si X es una función cualquiera con dominio  , cuyo rango es el conjunto no vacío
de números reales, se tiene,

 [X  x  2  n ]  [X  x ]
n 1
Teorema: Sea X una función de dominio  , cuyo rango es el conjunto no vacío de
números reales X, será una variable aleatoria siempre y cuando para cualquier
número real x, sea [X  x ]  , también lo será siempre y cuando, [X  x ]  , para
todo número real x
Álgebra de las Variables Aleatorias.
6
Teoremas: Si X y Y son variables aleatorias y k una constante real cualquiera,
también serán variables aleatorias:
X  Y,
kX, X2, XY,
(X  Y)2,
[(X+Y)2-(X-Y)2]/4,
max{X,Y}, y
X/Y cuando sí [Y=0]=  .
Teorema: Sea A un conjunto de sucesos elementales en  , IA será una variable
aleatoria siempre y cuando A  , siendo IA el indicador de A, que se define como
una función,
 1, si   A
IA  
c
0, si   A
lo que debe leerse como, Verdaderamente, I indica a A, pues si ocurre A ocurrirá
alguno de los sucesos elementales  en A, e IA(  )=1, mientras que si A no ocurre,
ocurrirá alguno de los sucesos  en Ac, y entonces, IA(  )=0
Teorema: Sea A un conjunto de sucesos elementales en  , IA será una variable
aleatoria siempre y cuando sea A  . Trabajar con,
 , si x  0

[I A  x ]  A c , si 0  x  1
 , si 1  x

Teorema: Para cualquier I  =1, es decir, I  ()  1 para cualquier  
Teoremas: Sea la existencia de IA e IB y demás funciones que aquí se relacionan,
entonces se cumple,
(I A ) 2  I A , A 
1  I A  I A c , A 
I A I B  I AB , A y B 
I A  B  max{ I A , I B }, A y B 
I A  I B  I A  B , par A, B de sucesos disjuntos
Teorema:
Si
X
y
Y
[min( X, Y)  z]  [X  z]  [Y  z]
son
variables
aleatorias,
entonces,
Función de probabilidad o distribución de probabilidad En la Tabla anterior (en
la definición de la variable aleatoria y ejemplarizó con un lanzamiento de dos dados
regulares) vemos que a cada valor posible de X, le asignamos un número
7
correspondiente a su probabilidad. Así podemos definir otra función: f(x) = P(X = x),
para cada número x en el campo de valores de la variable X. Esta función se llama la
función de probabilidad o distribución de probabilidad de la variable X. Para el
ejemplo de la suma de los puntos al tirar dos dados, los valores de esta función están
dados en la Tabla, la cual se puede reescribir usando los conceptos estudiados.
x
2
3
4
5
6
7
8
9
10
11
12
f( x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Vemos que f(x) nunca adquiere un valor menor de cero. Esto se debe a que f(x)
representa una probabilidad, la cual nunca puede ser menor de cero. De igual manera
f(x) nunca puede ser menor de 1. Si sumamos todos lo valores que puede tener f(x)
obtenemos 1, debido a que estamos sumando las probabilidades de que la variable
aleatoria asuma uno de los valores establecidos. Por su definición, la función de
probabilidad tiene las siguientes características:
1. f(x)≥0 para todo valor x en su dominio
2. 
donde la sumatoria se extiende sobre todos los valores x en el dominio
de f.
La probabilidad de observar un valor particular de la variable aleatoria, digamos X =
3 está dado por la altura de la barra sobre el 3, es decir P(X = 3) = 2/36. De igual
manera, en vez de asociar la altura de la barra con la probabilidad, podemos ver que
el área de la barra sobre el 3 es 2/36 1 = 2/36, ya que la altura de la barra es 2/36 y
su ancho es 1. Usar el área de las barras para representar la probabilidad es muy útil
para extender la noción de probabilidad a otras variables.
Podemos usar el histograma de probabilidad para calcular probabilidades tal como P(
X 4). Vemos que P(X 4) = P(X =2 ó X =3 ó X =4) = P(X = 2) + P(X = 3) + P(X =
4) , ya que los eventos donde X = 2, X= 3 y X=4 son disjuntos. Entonces P( X 4) =
1/36 + 2/36 + 3/36 = 6/36, sumando las áreas de la barras que están sobre el 4 y a su
izquierda. Debemos ser muy cuidadosos con las desigualdades, ya que P( X 4) =
6/36, mientras que P( X< 4) = 3/26.
8
Extendiendo esta idea de probabilidades acumulativas, podemos definir otra función
partiendo de la distribución de probabilidad. Si X es una variable aleatoria discreta,
definimos la función de distribución de X o función de distribución acumulativa
de X de la siguiente manera: F(x) = P( X≤x ) = f(t) para x en el intervalo (-∞,∞)

9