Download Documento PDF
Document related concepts
no text concepts found
Transcript
Capı́tulo 5 Variables aleatorias 5.1. Introducción Normalmente, los resultados posibles (espacio muestral E) de un experimento aleatorio no son valores numéricos. Por ejemplo, si el experimento consiste en lanzar de modo ordenado tres monedas al aire, para observar el número de caras (C) y cruces (R) que se obtienen, el espacio muestral asociado a dicho experimento aleatorio serı́a: E = {CCC, CCR, CRC, CRR, RCC, RCR, RRC, RRR} En estadı́stica resulta más fácil utilizar valores numéricos en lugar de trabajar directamente con los elementos de un espacio muestral como el anterior. Ası́ preferimos identificar los sucesos {CRR, RCR, RRC} con el valor numérico 1 que representa el número de caras obtenidas al realizar el experimento. De este modo aparece el concepto de variable aleatoria unidimensional como el de toda función X : E −→ IR e 7−→ X(e) = xe que atribuye un único número real xe , a cada suceso elemental e, del espacio muestral E 123 124 Bioestadı́stica: Métodos y Aplicaciones Por ejemplo, en el ejemplo anterior, se define la variable aleatoria (v.a. en adelante) X ≡ número de caras del siguiente modo: X : E −→ IR X(CCC) = 3 X(CCR) = X(CRC) = X(RCC) = 2 X(RRC) = X(RCR) = X(CRR) = 1 X(RRR) = 0 En función de los valores que tome la variable, esta puede ser clasificada en discreta o continua del siguiente modo: v.a. discreta es aquella que sólo puede tomar un número finito o infinito numerable de valores. Por ejemplo, X : E −→ IN v.a. continua es la que puede tomar un número infinito no numerable de valores. X : E −→ IR Vamos a estudiar los conceptos más importantes relacionados con la distribución de probabilidad de una v.a., diferenciando entre los casos de v.a. discreta y v.a. continua. 5.2. VARIABLES ALEATORIAS DISCRETAS 5.2. 125 Variables aleatorias discretas Dada una v.a. discreta X : E −→ IN , su función de probabilidad f , se define de modo que f (xi ) es la probabilidad de que X tome ese valor: f : IN −→ [0, 1] xi 7−→ f (xi ) = P[X = xi ] = P [{e, t.q. X(e) = xi }] Si xi no es uno de los valores que puede tomar X, entonces f (xi ) = 0. La representación gráfica de la función de probabilidad se realiza mediante un diagrama de barras análogo al de distribución de frecuencias relativas para variables discretas. Por ejemplo, si retomamos el caso del lanzamiento de 3 monedas de forma que cada una de ellas tenga probabilidad 1/2 de dar como resultado cara o cruz, se tiene que (véase la figura 5.1): f (3) = P[X = 3] = P[{CCC}] = 1 1 1 1 · · = 2 2 2 8 f (2) = P[X = 2] = P[{RCC, CCR, CRC}] = 1 1 1 3 + + = 8 8 8 8 f (1) = P[X = 3] = P[{RRC, RCR, CRR}] = f (0) = P[X = 0] = P[{RRR}] = 3 1 1 1 + + = 8 8 8 8 1 1 1 1 · · = 2 2 2 8 Otro concepto importante es el de función de distribución de una variable aleatoria discreta, F , que se define de modo que si xi ∈ IR, F (xi ) es igual a la probabilidad de que X tome un valor inferior o igual a xi : F : IN −→ [0, 1] xi 7−→ F (xi ) = P[X ≤ xi ] = P [{e, t.q. X(e) ≤ xi }] 126 Bioestadı́stica: Métodos y Aplicaciones Figura 5.1: Equivalencia entre las probabilidades calculadas directamente sobre el espacio muestral E de resultados del experimento aleatorio, y las calculadas sobre el subconjunto {0, 1, 2, 3} ⊂ IN ⊂ IR mediante la v.a. X. Esta función se representa gráficamente del mismo modo que la distribución de frecuencias relativas acumuladas (figura 5.2). Volviendo al ejemplo de las tres monedas, se tiene que F (0) = P[X ≤ 0] = P[X = 0] = f (0) = F (1) = P[X ≤ 1] = f (0) + f (1) = 1 3 4 + = 8 8 8 F (2) = P[X ≤ 2] = f (0) + f (1) + f (2) = F (3) = P[X ≤ 3] = f (0) + f (1) + f (2) + f (3) = 5.3. 1 8 1 3 3 7 + + = 8 8 8 8 8 1 3 3 1 + + + = =1 8 8 8 8 8 Variables aleatorias continuas Si una variable discreta toma los valores x1 , . . . , xk , la probabilidad de que al hacer un experimento, X tome uno de esos valores es 1, de modo que cada posible valor xi contribuye con una cantidad f (xi ) al total: 5.3. VARIABLES ALEATORIAS CONTINUAS 1 Func. Probabilidad f 7/8 127 Func. Distribucion ’ F 4/8 3/8 1/8 1/8 0 1 2 3 Figura 5.2: Función de probabilidad a la izquierda, y función de distribución a la derecha de una v.a. discreta k X f (xi ) = k X P[X = xi ] = 1 i=1 i=1 Aun cuando la variable tomase un número infinito de valores, x1 , x2 , . . . , no hay ningún problema en comprobar que cada xi contribuye con una cantidad f (xi ) al total de modo que ∞ X i=1 f (xi ) = ∞ X P[X = xi ] = 1 i=1 Cuando la variable es continua, no tiene sentido hacer una suma de las probabilidades de cada uno de los términos en el sentido anterior, ya que el conjunto de valores que puede tomar la variable es no numerable. En este P caso, lo que generaliza de modo natural el concepto de suma ( ) es el de R integral ( ). Por otro lado, para variables continuas no tiene interés hablar de la probabilidad de que X = x ∈ IR, ya que esta debe de valer siempre 0, para que la suma infinita no numerable de las probabilidades de todos los valores de la variable no sea infinita. 128 Bioestadı́stica: Métodos y Aplicaciones De este modo es necesario introducir un nuevo concepto que sustituya en v.a. continuas, al de función de probabilidad de una v.a. discreta. Este concepto es el de función de densidad de una v.a. continua, que se define como una función f : IR −→ IR integrable, que verifica las dos propiedades siguientes: f (x) ≥ 0 Z +∞ f (x) dx = 1 (5.1) −∞ y que además verifica que dado a < b, se tiene que P[a ≤ X ≤ b] = Z b f (x) dx (5.2) a f P[a<X<b] a b X Figura 5.3: Función de densidad f . La probabilidad de un intervalo, es el área que existe entre la función y el eje de abscisas. La función de distribución de la v.a. continua, F , se define de modo que dado x ∈ IR, F(x) es la probabilidad de que X sea menor o igual que x, es decir F : IR −→ [0, 1] x 7−→ F (x) = P[X ≤ x] = Z (5.3) x f (t) dt −∞ 5.4. MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN DE V.A.129 F(x) f(x) Area=F(x) x Figura 5.4: Función de distribución F , calculada a partir de la función de densidad f . 5.4. Medidas de tendencia central y dispersión de v.a. De forma análoga a lo que se se hizo en el capı́tulo 2 sobre estadı́stica descriptiva podemos definir para variables aleatorias medidas de centralización, dispersión, simetrı́a y forma. Por su interés nos vamos a centrar en dos medidas sobre v.a. que son la esperanza matemática que desempeña un papel equivalente al de la media y el momento central de segundo orden, también denominado varianza. 130 5.4.1. Bioestadı́stica: Métodos y Aplicaciones Valor esperado o esperanza matemática La esperanza matemática o valor esperado de una variable aleatoria es el concepto equivalente al de media aritmética. Como las variables aleatorias se expresan de modo diferente en el caso discreto que en el continuo, tratemos a cada una de llas por separado. Sea X una v.a. discreta. Se denomina esperanza matemática de X o valor esperado, y se denota bien E [X] o bien µ, a la cantidad que se expresa como: E [X] = X xi f (xi ) (5.4) i∈II donde II es el conjunto numerable de ı́ndices de los valores que puede tomar la variable (por ejemplo II = {1, 2, . . . , k} para un número finito de valores de la v.a. o bien II = IN para una cantidad infinita numerable de los mismos. Si X es una v.a. continua, se define su esperanza a partir de la función de densidad como sigue: +∞ Z x · f (x) dx E [X] = (5.5) −∞ 5.4.2. Varianza La varianza la denotamos mediante Var [X] o bien σ 2 : h i Var [X] = E (X − E [X])2 = X (xi − E [X])2 f (xi ) i∈II Z +∞ −∞ (x − E [X])2 · f (x) dx si X disc. si X cont.