Download Documento PDF

Document related concepts
no text concepts found
Transcript
Capı́tulo 5
Variables aleatorias
5.1.
Introducción
Normalmente, los resultados posibles (espacio muestral E) de un experimento aleatorio no son valores numéricos. Por ejemplo, si el experimento
consiste en lanzar de modo ordenado tres monedas al aire, para observar
el número de caras (C) y cruces (R) que se obtienen, el espacio muestral
asociado a dicho experimento aleatorio serı́a:
E = {CCC, CCR, CRC, CRR, RCC, RCR, RRC, RRR}
En estadı́stica resulta más fácil utilizar valores numéricos en lugar de
trabajar directamente con los elementos de un espacio muestral como el
anterior. Ası́ preferimos identificar los sucesos {CRR, RCR, RRC} con el
valor numérico 1 que representa el número de caras obtenidas al realizar
el experimento. De este modo aparece el concepto de variable aleatoria
unidimensional como el de toda función
X : E −→ IR
e 7−→ X(e) = xe
que atribuye un único número real xe , a cada suceso elemental e, del espacio
muestral E
123
124
Bioestadı́stica: Métodos y Aplicaciones
Por ejemplo, en el ejemplo anterior, se define la variable aleatoria (v.a.
en adelante)
X ≡ número de caras
del siguiente modo:
X : E −→ IR
X(CCC) = 3
X(CCR) = X(CRC) = X(RCC) = 2
X(RRC) = X(RCR) = X(CRR) = 1
X(RRR) = 0
En función de los valores que tome la variable, esta puede ser clasificada
en discreta o continua del siguiente modo:
v.a. discreta es aquella que sólo puede tomar un número finito o infinito
numerable de valores. Por ejemplo,
X : E −→ IN
v.a. continua es la que puede tomar un número infinito no numerable de
valores.
X : E −→ IR
Vamos a estudiar los conceptos más importantes relacionados con la
distribución de probabilidad de una v.a., diferenciando entre los casos de
v.a. discreta y v.a. continua.
5.2. VARIABLES ALEATORIAS DISCRETAS
5.2.
125
Variables aleatorias discretas
Dada una v.a. discreta X : E −→ IN , su función de probabilidad f , se
define de modo que f (xi ) es la probabilidad de que X tome ese valor:
f : IN
−→ [0, 1]
xi 7−→ f (xi ) = P[X = xi ] = P [{e, t.q. X(e) = xi }]
Si xi no es uno de los valores que puede tomar X, entonces f (xi ) = 0. La
representación gráfica de la función de probabilidad se realiza mediante un
diagrama de barras análogo al de distribución de frecuencias relativas para
variables discretas. Por ejemplo, si retomamos el caso del lanzamiento de
3 monedas de forma que cada una de ellas tenga probabilidad 1/2 de dar
como resultado cara o cruz, se tiene que (véase la figura 5.1):
f (3) = P[X = 3] = P[{CCC}] =
1 1 1
1
· · =
2 2 2
8
f (2) = P[X = 2] = P[{RCC, CCR, CRC}] =
1 1 1
3
+ + =
8 8 8
8
f (1) = P[X = 3] = P[{RRC, RCR, CRR}] =
f (0) = P[X = 0] = P[{RRR}] =
3
1 1 1
+ + =
8 8 8
8
1 1 1
1
· · =
2 2 2
8
Otro concepto importante es el de función de distribución de una
variable aleatoria discreta, F , que se define de modo que si xi ∈ IR, F (xi )
es igual a la probabilidad de que X tome un valor inferior o igual a xi :
F : IN
−→ [0, 1]
xi 7−→ F (xi ) = P[X ≤ xi ] = P [{e, t.q. X(e) ≤ xi }]
126
Bioestadı́stica: Métodos y Aplicaciones
Figura 5.1: Equivalencia entre las probabilidades calculadas directamente
sobre el espacio muestral E de resultados del experimento aleatorio, y las
calculadas sobre el subconjunto {0, 1, 2, 3} ⊂ IN ⊂ IR mediante la v.a. X.
Esta función se representa gráficamente del mismo modo que la distribución
de frecuencias relativas acumuladas (figura 5.2). Volviendo al ejemplo de
las tres monedas, se tiene que
F (0) = P[X ≤ 0] = P[X = 0] = f (0) =
F (1) = P[X ≤ 1] = f (0) + f (1) =
1 3
4
+ =
8 8
8
F (2) = P[X ≤ 2] = f (0) + f (1) + f (2) =
F (3) = P[X ≤ 3] = f (0) + f (1) + f (2) + f (3) =
5.3.
1
8
1 3 3
7
+ + =
8 8 8
8
8
1 3 3 1
+ + + = =1
8 8 8 8
8
Variables aleatorias continuas
Si una variable discreta toma los valores x1 , . . . , xk , la probabilidad de que
al hacer un experimento, X tome uno de esos valores es 1, de modo que
cada posible valor xi contribuye con una cantidad f (xi ) al total:
5.3. VARIABLES ALEATORIAS CONTINUAS
1
Func. Probabilidad
f
7/8
127
Func. Distribucion
’
F
4/8
3/8
1/8
1/8
0
1
2
3
Figura 5.2: Función de probabilidad a la izquierda, y función de distribución
a la derecha de una v.a. discreta
k
X
f (xi ) =
k
X
P[X = xi ] = 1
i=1
i=1
Aun cuando la variable tomase un número infinito de valores, x1 , x2 , . . . ,
no hay ningún problema en comprobar que cada xi contribuye con una
cantidad f (xi ) al total de modo que
∞
X
i=1
f (xi ) =
∞
X
P[X = xi ] = 1
i=1
Cuando la variable es continua, no tiene sentido hacer una suma de las
probabilidades de cada uno de los términos en el sentido anterior, ya que el
conjunto de valores que puede tomar la variable es no numerable. En este
P
caso, lo que
generaliza de modo natural el concepto de suma ( ) es el de
R
integral ( ). Por otro lado, para variables continuas no tiene interés hablar
de la probabilidad de que X = x ∈ IR, ya que esta debe de valer siempre 0,
para que la suma infinita no numerable de las probabilidades de todos los
valores de la variable no sea infinita.
128
Bioestadı́stica: Métodos y Aplicaciones
De este modo es necesario introducir un nuevo concepto que sustituya
en v.a. continuas, al de función de probabilidad de una v.a. discreta. Este
concepto es el de función de densidad de una v.a. continua, que se
define como una función f : IR −→ IR integrable, que verifica las dos
propiedades siguientes:

f (x) ≥ 0



Z +∞



f (x) dx = 1
(5.1)
−∞
y que además verifica que dado a < b, se tiene que
P[a ≤ X ≤ b] =
Z
b
f (x) dx
(5.2)
a
f
P[a<X<b]
a
b
X
Figura 5.3: Función de densidad f . La probabilidad de un intervalo, es el
área que existe entre la función y el eje de abscisas.
La función de distribución de la v.a. continua, F , se define de
modo que dado x ∈ IR, F(x) es la probabilidad de que X sea menor o igual
que x, es decir
F : IR −→ [0, 1]
x 7−→ F (x) = P[X ≤ x] =
Z
(5.3)
x
f (t) dt
−∞
5.4. MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN DE V.A.129
F(x)
f(x)
Area=F(x)
x
Figura 5.4: Función de distribución F , calculada a partir de la función de
densidad f .
5.4.
Medidas de tendencia central y dispersión de
v.a.
De forma análoga a lo que se se hizo en el capı́tulo 2 sobre estadı́stica
descriptiva podemos definir para variables aleatorias medidas de centralización, dispersión, simetrı́a y forma. Por su interés nos vamos a centrar en
dos medidas sobre v.a. que son la esperanza matemática que desempeña un
papel equivalente al de la media y el momento central de segundo orden,
también denominado varianza.
130
5.4.1.
Bioestadı́stica: Métodos y Aplicaciones
Valor esperado o esperanza matemática
La esperanza matemática o valor esperado de una variable aleatoria
es el concepto equivalente al de media aritmética.
Como las variables aleatorias se expresan de modo diferente en el caso
discreto que en el continuo, tratemos a cada una de llas por separado.
Sea X una v.a. discreta. Se denomina esperanza matemática de X
o valor esperado, y se denota bien E [X] o bien µ, a la cantidad que se
expresa como:
E [X] =
X
xi f (xi )
(5.4)
i∈II
donde II es el conjunto numerable de ı́ndices de los valores que puede tomar
la variable (por ejemplo II = {1, 2, . . . , k} para un número finito de valores
de la v.a. o bien II = IN para una cantidad infinita numerable de los mismos.
Si X es una v.a. continua, se define su esperanza a partir de la función
de densidad como sigue:
+∞
Z
x · f (x) dx
E [X] =
(5.5)
−∞
5.4.2.
Varianza
La varianza la denotamos mediante Var [X] o bien σ 2 :
h
i
Var [X] = E (X − E [X])2 =
 X

(xi − E [X])2 f (xi )



 i∈II
Z





+∞
−∞
(x − E [X])2 · f (x) dx
si X disc.
si X cont.