Download La Variable Aleatoria Archivo
Document related concepts
no text concepts found
Transcript
05. VARIABLE ALEATORIA En gran cantidad de experimentos aleatorios es necesario cuantificar los resultados, es decir, asignar a cada resultado del experimento un número, con el fin de poder realizar un estudio matemático. Ejemplos. Consideremos el experimento aleatorio que consiste en lanzar tres monedas, supongamos que a cada elemento de su espacio muestral E=(CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS) le asignamos un número real, el correspondiente al número de caras. Esta correspondencia que acabamos de construir es una función del espacio muestral E en el conjunto de los números reales R. A esta función la llamaremos Variable Aleatoria y la denotaremos por X. Supongamos el experimento aleatorio que consiste en lanzar dos dados, podemos asignar a cada resultado la suma de los puntos aparecidos en cada dado (discreta). Consideremos el experimento que consiste en elegir al azar 500 personas y medir su estatura. La ley que asocia a cada persona con su talla es una variable aleatoria (continua). Variable Aleatoria. Se dice que hemos definido una variable aleatoria para un experimento aleatorio cuando hemos asociado un valor numérico a cada resultado del experimento. Sea E el Espacio muestral asociado a un experimento. Se llama variable aleatoria a toda aplicación del espacio muestral E en el conjunto de los números reales (es decir, asocia a cada elemento de E un número real). Se utilizan letras mayúsculas X, Y,... para designar variables aleatorias, y las respectivas minúsculas (x, y, ...) para designar valores concretos de las mismas. Si un experimento con espacio muestral E, tiene asociada la variable aleatoria X, es natural que se planteen preguntas como: ¿Cuál es la probabilidad de que X tome un determinado valor?, esto nos lleva a establecer, por convenio, la siguiente notación, - (X=x) representa el suceso "la Variable Aleatoria X toma el valor x", y P(X=x) representa la probabilidad de dicho suceso. 1 - (X<x) representa el suceso "la variable aleatoria X toma un valor menor a x", y P(X<x) representa la probabilidad de que la Variable Aleatoria X tome un valor menor a x. - (X ) representa el suceso "la variable aleatoria X toma un valor menor o igual a x”, y P(X ) representa la probabilidad de que la Variable Aleatoria X tome un valor menor o igual a x. Normalmente, los resultados posibles (Espacio muestral E) de un experimento aleatorio no son valores numéricos. Por ejemplo, si el experimento consiste en lanzar de modo ordenado tres monedas al aire, para observar el número de caras (C) y Sellos (S) que se obtienen, el espacio muestral asociado a dicho experimento aleatorio sería: E=(CCC,CCS,CSC,SCC,SCS,SSC,CSS,SSS) En estadística resulta más fácil utilizar valores numéricos en lugar de trabajar directamente con los elementos de un espacio muestral como el anterior. Así preferimos identificar los sucesos (CSS,SCS,SSC) con el valor numérico 1 que representa el número de caras obtenidas al realizar el experimento. De este modo aparece el concepto de variable aleatoria unidimensional como el de toda función X:E e X ( e) x e que atribuye un único número real xe, a cada suceso elemental e, del espacio muestral E. Por ejemplo, en el ejemplo anterior, se define la variable aleatoria: X=Número de caras del siguiente modo: X(CCC)=3; X(CCS,CSC,SCC)=2; y X(SSC,CSS,SCS)=1, y finalmente X(SSS)=0, puesto que estamos hablando de caras - La variable X no recibe el calificativo de aleatoria por el hecho de que atribuya de modo imprevisible un valor cualquiera a un elemento (e está incluido en E) ya que este valor está definido de forma precisa (determinística). Lo que es aleatorio en realidad, es que al hacer el experimento, no sabemos qué elemento de E puede ocurrir. - La composición de una función real con una variable es también variable aleatoria, pues está definida sobre E y a cada elemento suyo le asocia un valor real. X:E E h (X) h ó h : x h (X(e)) 2 En función de los valores que tome la variable, esta puede ser clasificada en discreta o continua del siguiente modo que es Discreta cuando sólo puede tomar un número finito o infinito numerable de valores, por ejemplo, el conjunto de los números naturales; y es Continua cuando puede tomar un número infinito no numerable de valores, por ejemplo, el conjunto de los número reales. En un caso se habla de elementos contables y en el otro de elementos medibles Si sobre los elementos de E existe una distribución de probabilidad, esta se transmite a los valores que toma la variable X. Es decir, toda la variable aleatoria conserva la estructura probabilística del experimento aleatorio que describe, en el sentido de que si P es la función de probabilidad definida sobre el espacio muestral E, ésta induce otra función P` definida sobre el conjunto de los reales, de forma que conserva los valores de las probabilidades, P (X x ) Pe E : X(E) x ó P X (a , b) Pe E : X(e) (a , b) Variable Aleatoria Discreta. Dada una Variable Aleatoria Discreta X, su función de probabilidad f, se define de modo que f(xi) es la probabilidad de que X tome ese valor. Si xi no es uno de los valores que puede tomar X, entonces f(xi)=0. La representación gráfica de la función de probabilidad se realiza mediante un diagrama de barras análogo al de distribución de frecuencias relativas para variables discretas. Ejemplo, si retomamos el caso del lanzamiento de 3 monedas de forma que cada una de ellas tenga probabilidad 1/2 de dar como resultado cara o sello, se tiene que, f (3) P(X 3) P(CCC) 1 / 2 *1 / 2 * / 2 1 / 8 f (2) P(X 2) P(CCS, CSC, SCC) 1 / 8 1 / 8 1 / 8 3 / 8 f (1) P(X 1) P(SSC, SCS, CSS) 1 / 8 1 / 8 1 / 8 3 / 8 f (0) P(X 0) P(SSS) 1 / 2 *1 / 2 *1 / 2 1 / 8 Obsérvese que X está definido sobre el espacio muestral de sucesos E, mientras que f lo está sobre el espacio de números reales .Las propiedades de la función de probabilidad de Variable Aleatoria se deducen de forma inmediata de los axiomas de probabilidad, Si x1,…,xn son todos los valores admisibles de la variable aleatoria X, entonces, la suma de probabilidades de todos los valores es UNO (1): k k i 1 i 1 f ( X i ) P( X x i ) 1 e igualmente todos estos valores deben ser positivos. 3 Otro concepto importante es el de función de distribución de una variable aleatoria discreta, F, que se define de modo que si x pertenece al conjunto de los valores reales, F(xi) es igual a la probabilidad de que X tome un valor inferior o igual a xi: F(xi)=P(X≤xi) Esta función se representa gráficamente del mismo modo que la distribución de frecuencias relativas acumuladas. Volviendo al ejemplo de las tres monedas, se tiene que F(3) P(X 3) f (0) f (1) f (2) f (3) 1 / 8 3 / 8 3 / 8 1 / 8 1 F(2) P(X 2) f (0) f (1) f (2) 1 / 8 3 / 8 3 / 8 7 / 8 F(1) P(X 1) F(0) f (1) 1 / 8 3 / 8 4 / 8 F(0) P(X 0) f (0) 1 / 8 Gráficamente, Variables aleatorias discretas Problema. Lanzamos dos dados al aire. Nos interesa encontrar probabilidades tal como la probabilidad de que la suma de los puntos en los dados es menor que 8. Si asumimos que todos los resultados observados al tirar dos dados son equiprobables entonces el espacio muestral del experimento, con treinta y seis posibles resultados es: 1 1, 1 1, 2 1, 3 1, 4 1, 5 1, 6 1 2 2, 1 2, 2 2, 3 2, 4 2, 5 2, 6 2 3 3, 1 3, 2 3, 3 3, 4 3, 5 3, 6 3 4 4, 1 4, 2 4, 3 4, 4 4, 5 4, 6 4 5 5, 1 5, 2 5, 3 5, 4 5, 5 5, 6 5 4 Como nos interesa la suma de los puntos observados, si obtenemos el resultado (3, 5) le asignamos el valor 8, correspondiente a la suma de 3 y 5. Podemos calcular la probabilidad de que la suma sea igual a 8, contando todos los resultados donde la suma es ocho. El evento de que la suma es ocho contiene 5 resultados: {(2,6), (3,5), (4,4), (5, 3), (6,2)}; por lo tanto la probabilidad deseada es 5/36. Podemos repetir este proceso con cada uno de los resultados para obtener la siguiente tabla: Resultado 2 3 4 5 6 7 8 9 10 11 12 Probabilidad 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Hemos encontrado la distribución de probabilidad de los valores posibles de la suma al tirar dos dados. En general, si S es un espacio muestral con una medida de probabilidad P, definimos una variable aleatoria como una función que asigna un número real a cada uno de los elementos de S. Es decir X es una función cuyo dominio es el espacio muestral S y su codominio es el conjunto de números reales Interpretamos, por ejemplo X = 8 como el evento de que se observó el resultado 8 al tirar los dos dados, es decir el evento { (2,6), (3,5), (4,4), (5, 3), (6,2)} ocurrió. También asignamos a X = 8 la probabilidad de ese evento. Así vemos que P( X = 8 ) = P({ (2,6), (3,5), (4,4), (5, 3), (6,2)}) = 5/36. Nota que a pesar de que X es una función, usualmente no se escribe el argumento de la función, es decir, si s es un elemento del espacio muestral S, en vez de escribir X(s), sencillamente escribimos X. Es usual denotar las variables aleatorias por letras mayúsculas y los valores que puede asumir por letras minúsculas. Par Ordenado. Sea un conjunto {a,b} constituido por los elementos a y b, el {a , b} el conjunto de todos los subconjuntos del conjunto {a,b}, que consta de los elementos , {a}, {b}, {a,b}. Se llama par ordenado a , b al subconjunto {{a},{a,b}} de {a , b} Si A y B son dos conjuntos, el Producto Cartesiano, A B , es el conjunto de todos los posibles pares ordenados a , b formados con el primer elemento a que pertenece a A y un segundo elemento b que pertenece a B, esto es, A B a, b a A, b B Una Relación R entre los conjuntos A y B es un subconjunto de A B Se llama Dominio de una Relación R entre A y B, y se designa por domR, al conjunto de los elementos a A tales que para algún b B sea a , b R , esto es, en símbolos, domR a A para a lg un b B,a, b R, o sea, el dominio de una relación es el conjunto de las primeras coordenadas de los pares ordenados de R 5 Se denomina Rango de una relación R, rgR, o recorrido de R, recR, al conjunto de aquellos elementos b B , tales que para algún b B , sea a , b R , o sea, en otras palabras, rgR b B para a lg un a A,a, b R Una Función f de A a B, lo que quiere decir, una función f cuyo dominio esta en A y cuyo rango está en B, es una relación entre A y B con estas condiciones, domf A, a, b1 f , y a, b 2 f , debe ser b1=b2 Variable Aleatoria. Sea un conjunto fundamental de probabilidades y sea el sigma – anillo de sucesos sobre . La variable aleatoria X es una función cuyo dominio es y cuyo rango es un conjunto no vacío de números reales, con la condición de que para cualquier número real x, el conjunto de sucesos elementales para los que X() x sea un suceso, esto es, un elemento de . O sea, X() x Sigma – Espacio. (,, P) , es el conjunto de los subconjuntos de Notación, Desde este punto, se trabajara con la notación X x en vez de X() x y X S en vez de X() S, lo que permitirá ajustarnos mas a lo normal de a literatura estadística y normal de otros textos. Si X es una función cualquiera con dominio , cuyo rango es el conjunto no vacío de números reales, entonces, se verifica que, [X x 2 n ] [X x ] n 1 para cualquier número real x Si X es una función cualquiera con dominio , cuyo rango es el conjunto no vacío de números reales, se tiene, [X x 2 n ] [X x ] n 1 Teorema: Sea X una función de dominio , cuyo rango es el conjunto no vacío de números reales X, será una variable aleatoria siempre y cuando para cualquier número real x, sea [X x ] , también lo será siempre y cuando, [X x ] , para todo número real x Álgebra de las Variables Aleatorias. 6 Teoremas: Si X y Y son variables aleatorias y k una constante real cualquiera, también serán variables aleatorias: X Y, kX, X2, XY, (X Y)2, [(X+Y)2-(X-Y)2]/4, max{X,Y}, y X/Y cuando sí [Y=0]= . Teorema: Sea A un conjunto de sucesos elementales en , IA será una variable aleatoria siempre y cuando A , siendo IA el indicador de A, que se define como una función, 1, si A IA c 0, si A lo que debe leerse como, Verdaderamente, I indica a A, pues si ocurre A ocurrirá alguno de los sucesos elementales en A, e IA( )=1, mientras que si A no ocurre, ocurrirá alguno de los sucesos en Ac, y entonces, IA( )=0 Teorema: Sea A un conjunto de sucesos elementales en , IA será una variable aleatoria siempre y cuando sea A . Trabajar con, , si x 0 [I A x ] A c , si 0 x 1 , si 1 x Teorema: Para cualquier I =1, es decir, I () 1 para cualquier Teoremas: Sea la existencia de IA e IB y demás funciones que aquí se relacionan, entonces se cumple, (I A ) 2 I A , A 1 I A I A c , A I A I B I AB , A y B I A B max{ I A , I B }, A y B I A I B I A B , par A, B de sucesos disjuntos Teorema: Si X y Y [min( X, Y) z] [X z] [Y z] son variables aleatorias, entonces, Función de probabilidad o distribución de probabilidad En la Tabla anterior (en la definición de la variable aleatoria y ejemplarizó con un lanzamiento de dos dados regulares) vemos que a cada valor posible de X, le asignamos un número 7 correspondiente a su probabilidad. Así podemos definir otra función: f(x) = P(X = x), para cada número x en el campo de valores de la variable X. Esta función se llama la función de probabilidad o distribución de probabilidad de la variable X. Para el ejemplo de la suma de los puntos al tirar dos dados, los valores de esta función están dados en la Tabla, la cual se puede reescribir usando los conceptos estudiados. x 2 3 4 5 6 7 8 9 10 11 12 f( x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Vemos que f(x) nunca adquiere un valor menor de cero. Esto se debe a que f(x) representa una probabilidad, la cual nunca puede ser menor de cero. De igual manera f(x) nunca puede ser menor de 1. Si sumamos todos lo valores que puede tener f(x) obtenemos 1, debido a que estamos sumando las probabilidades de que la variable aleatoria asuma uno de los valores establecidos. Por su definición, la función de probabilidad tiene las siguientes características: 1. f(x)≥0 para todo valor x en su dominio 2. donde la sumatoria se extiende sobre todos los valores x en el dominio de f. La probabilidad de observar un valor particular de la variable aleatoria, digamos X = 3 está dado por la altura de la barra sobre el 3, es decir P(X = 3) = 2/36. De igual manera, en vez de asociar la altura de la barra con la probabilidad, podemos ver que el área de la barra sobre el 3 es 2/36 1 = 2/36, ya que la altura de la barra es 2/36 y su ancho es 1. Usar el área de las barras para representar la probabilidad es muy útil para extender la noción de probabilidad a otras variables. Podemos usar el histograma de probabilidad para calcular probabilidades tal como P( X 4). Vemos que P(X 4) = P(X =2 ó X =3 ó X =4) = P(X = 2) + P(X = 3) + P(X = 4) , ya que los eventos donde X = 2, X= 3 y X=4 son disjuntos. Entonces P( X 4) = 1/36 + 2/36 + 3/36 = 6/36, sumando las áreas de la barras que están sobre el 4 y a su izquierda. Debemos ser muy cuidadosos con las desigualdades, ya que P( X 4) = 6/36, mientras que P( X< 4) = 3/26. 8 Extendiendo esta idea de probabilidades acumulativas, podemos definir otra función partiendo de la distribución de probabilidad. Si X es una variable aleatoria discreta, definimos la función de distribución de X o función de distribución acumulativa de X de la siguiente manera: F(x) = P( X≤x ) = f(t) para x en el intervalo (-∞,∞) 9