Download Tema 3: Variables aleatorias y vectores aleatorios bidimensionales

1

2

3

4

5

6

7

Document related concepts

no text concepts found

Transcript

38
Estadı́stica
Tema 3: Variables aleatorias y vectores aleatorios
bidimensionales
El concepto de variable aleatoria surge de la necesidad de hacer más manejables matemáticamente los
resultados de los experimentos aleatorios, que en muchos casos son cualitativos, y que siguen patrones muy
similares aunque la naturaleza del experimento no lo sea.
Por ejemplo, un experimento consistente en observar el resultado de tirar una moneda, si ésta está
trucada y la probabilidad de cara es 0.9 y la de cruz es 0.1, es similar al experimento observar una pieza
fabricada en un proceso que produce un 90% de piezas buenas y un 10% de piezas con defecto, pues en ambos
casos, los posibles resultados del experimento son dos y la asignación de probabilidades a los resultados es
igual. Sin embargo, ambos experimentos son de naturaleza totalmente diferente.
3.1 Variable aleatoria y ley de probabilidad asociada a la variable.
Definición 1 Dado un espacio muestral Ω asociado a un experimento aleatorio, llamaremos variable
aleatoria (v.a.) definida sobre Ω a una aplicación X de Ω en IR.
Por ejemplo, en los dos experimentos de la introducción, podrı́a definirse la aplicación X que asigna al
resultado “cara” el valor 1 y al resultado “cruz” el valor 0. Igualmente, en el caso de la pieza, podrı́a
definirse una variable asignando al resultado “buena” el valor 1 y al resultado “defectuosa” el valor 0.
Definición 2 Dada una variable aleatoria X definida sobre el conjunto de sucesos de un experimento
aleatorio, llamaremos soporte de X, que se denota por SX , al conjunto de posibles valores (números
reales) de la variable aleatoria.
Observación 1 El soporte de una variable aleatoria puede ser discreto o consistir en un intervalo de
IR. En los dos ejemplos anteriores, SX = {0, 1}.
El soporte de la variable aleatoria se puede considerar como un nuevo espacio muestral, sobre el que
se puede definir una probabilidad relacionada con la probabilidad definida sobre el espacio muestral
original Ω, de la siguiente forma:
dado A ⊂ IR, p(A) = p({ω ∈ Ω/X(ω) ∈ A})
De esta forma se define una aplicación con llegada en el intervalo [0,1], sobre los subconjuntos del
soporte que son imagen de un suceso de Ω y se puede demostrar que esta aplicación es una probabilidad.
Esta probabilidad se denomina probabilidad asociada a la v.a. X, ley de probabilidad de la v. a. X o
distribución de la v.a. X.
En el ejemplo:
p(1) = p(cara) = 0.9, p(0) = p(cruz) = 0.1
e igualmente:
p(1) = p(buena) = 0.9, p(0) = p(def ectuosa) = 0.1
39
Estadı́stica
Es decir, las probabilidades definidas sobre SX = {0, 1} son iguales, aún cuando los experimentos sean
diferentes. Una vez que se conoce el soporte de una variable aleatoria y su distribución, se puede
“olvidar” el experimento original. Cada variable aleatoria distinta (es decir, con soporte o distribución
distinta) constituye un modelo probabilı́stico. En el resto del tema y en los siguientes nos centraremos
en el estudio de estos modelos.
3.2 Variables aleatorias discretas.
Una variable aleatoria es discreta si su soporte es discreto, es decir, si consiste en un número finito o
numerable de resultados: SX = {x1 , x2 , . . . xn , . . .}.
Definición 3 La ley de probabilidad o distribución de una variable aleatoria discreta X queda determinada
por los valores p(xi ) = p(X = xi ), i = 1, 2, . . ..
Se puede extender la definición de p a cualquier número real, definiéndola como cero para todos los
x 6= xi , i = 1, 2, . . .. A esta función definida en IR se la denomina función de probabilidad o de masa
de la variable aleatoria.
Ejemplo:
El ejemplo más sencillo de variable discreta es la variable discreta uniforme, cuyo soporte es SX =
{x1 , x2 , . . . , xn } con probabilidades: p(xi ) = n1 .
Otra forma de definir la distribución de una v.a. discreta es mediante la función de distribución:
Definición 4 Llamaremos función de distribución de la variable aleatoria X a la función: F : IR 7−→
[0, 1] definida por:
F (x) = p(X ≤ x).
Propiedades 1
Propiedades de la función de distribución.
(a) lim F (x) = 1 y lim F (x) = 0.
x7→∞
x7→−∞
La primera igualdad se debe a que {X ≤ ∞} es todo el espacio muestral y la segunda a
que {X ≤ −∞} es su complementario.
(b) Si SX = {x1 , x2 , . . . xn , . . .} y los valores están ordenados de menor a mayor,
F (x) =
k
P
p(xi ), si x ∈ [xk , xk+1 ).
i=1
(c) F es creciente: si x ≤ y, F (x) ≤ F (y).
(d) F es continua a la derecha:
lim F (x + h) = F (x).
h7→0+
(e) p(xi ) = F (xi ) − F (xi−1 ).
(f ) Como consecuencia de todas las propiedades anteriores, la gráfica de F es discontinua con saltos
finitos en los puntos de probabilidad no nula, y creciente.
3.3 Variables aleatorias continuas.
De forma intuitiva, una variable aleatoria continua es aquella que toma valores en un intervalo de IR.
Posteriormente daremos una definición más rigurosa.
40
Estadı́stica
Vamos a introducir este concepto y el de distribución de una variable continua de forma intuitiva,
partiendo de un ejemplo.
Consideremos la medida del diámetro interior de un rodamiento de determinadas caracterı́sticas.
Esta medida puede considerarse una variable aleatoria pues las medidas de los distintos rodamientos
tomarán valores aleatorios dentro de un intervalo de IR más o menos amplio. Si tomamos 100 de estos
rodamientos, anotamos sus medidas y construimos el histograma correspondiente, después de haber
agrupado en clases, cada rectángulo del histograma tendrá área proporcional a la frecuencia relativa
de la clase correspondiente, y esta frecuencia se puede escribir como: fi = Fi+1 − Fi , donde fi es la
frecuencia relativa de la clase [xi , xi+1 ) y Fi+1 es la correspondiente frecuencia relativa acumulada.
Vamos a suponer que la razón de proporcionalidad es 1 y por tanto, que:
(xi+1 − xi )hi = Fi+1 − Fi
dónde hi es la altura del rectángulo. Podemos observar en ese histograma que el área total es 1 y que
la probabilidad de que una de las 100 piezas escogida al azar tenga su medida en el intervalo [xi , xi+1 )
es el área del histograma correspondiente a este intervalo
Si ahora medimos 1000 piezas y agrupamos en clases (igualmente espaciadas), obtendremos un nuevo
histograma; si tomamos 100000 piezas y agrupamos en clases, ..., los sucesivos histogramas van
a ir aproximándose a una curva (Ley de Regularidad Estadı́stica). ¿Cuál va a ser la altura f(x)
correspondiente a cada x del soporte de esta variable, en esa curva?.
En el histograma inicial, la altura de un punto x que estuviese en el intervalo [xi , xi+1 ) era:
hi =
Fi+1 − Fi
xi+1 − xi
e igualmente en los sucesivos histogramas, de forma que f(x) será el lı́mite de estas alturas cuando el
número de piezas observadas y el número de clases tiendan a infinito (y por tanto la amplitud de las
clases tienda a cero).
A esta curva lı́mite la vamos a llamar función de densidad. Su nombre proviene de la similitud entre el
concepto de probabilidad, las frecuencias relativas y la interpretación de éstas como masas. Cuando se
consideran variables aleatorias continuas, el soporte de la variable se puede interpretar como una varilla
delgada de masa unidad y densidad no constante, dada por la función de densidad de probabilidad
f(x).
Igual que en el caso de la varilla (en el que cada punto de la misma tiene masa cero) la probabilidad de
cada punto es cero, sin embargo, la probabilidad de un intervalo contenido en el soporte (equivalente
a la masa de un trozo de varilla) puede ser no nula.
Definición 5 Diremos que una variable aleatoria X es continua si existe una función
f : IR 7−→ IR, integrable, tal que:
(a) f (x) ≥ 0 para todo x ∈ IR.
(b)
R∞
−∞ f (x)dx
(c) p(X ≤ x) =
= 1.
Rx
−∞ f (t)dt.
A dicha función se la denomina función de densidad de la variable aleatoria X.
Observación 2 A partir de lo desarrollado en la introducción de este punto, se deduce que f (x)
describe el comportamiento “a largo plazo” ( es decir, cuando el número de observaciones tiende a
infinito) de la variable.
41
Estadı́stica
Ejemplo:
De nuevo, el ejemplo más sencillo de v. a. continua es la v.a. continua uniforme, que se define como
aquella que tiene densidad constante en un intervalo acotado de IR. Ası́, la v.a. continua uniforme en
[a, b] será la que tiene por soporte SX = [a, b] y densidad:
(
f (x) =
(¿Por qué
1
b−a
a≤x≤b
en otro caso
0
1
b−a ?)
Igual que ocurre con las v.a. discretas, la distribución de una v.a. continua se puede definir también
a partir de la función de distribución de la variable, que se define de igual forma:
Definición 6 Llamaremos función de distribución de la variable aleatoria X a la función: F : IR 7−→
[0, 1] definida por:
F (x) = p(X ≤ x).
Teniendo en cuenta la definición de función de densidad, se cumplen las siguientes propiedades:
Propiedades 2 (a) lim F (x) = 1 y lim F (x) = 0.
x7→∞
x7→−∞
(b) F es creciente: si x ≤ y, F (x) ≤ F (y).
(c) F (x) =
Rx
−∞ f (t)dt.
(d) F(x) es continua en IR.
(e) F(x) es derivable y F 0 (x) = f (x), para cada x ∈ R en el que la función de densidad es continua.
(f ) La probabilidad de un punto es nula.
(g) p([a, b]) = p((a, b]) = p([a, b)) = p((a, b)) = F (b) − F (a) =
Rb
a
f (t)dt.
Ejemplo:
La función de distribución de la v.a. continua uniforme será:
F (x) =


 0
si x ≤ a
a≤x≤b
si x ≥ b
x−a
b−a

 1
3.4 Medidas caracterı́sticas de una v.a.
Las medidas caracterı́sticas asociadas a una v.a. reciben el mismo nombre que en el caso de variables
estadı́sticas y se interpretan de idéntica forma. En este caso, para distinguir unas y otras, se representan
con letras griegas.
Vamos a definir a continuación las principales. Podrá observarse que en el caso discreto, las definiciones
son totalmente análogas a las dadas para v. estadı́sticas, si en éstas se cambia frecuencia relativa por
probabilidad.
Medida
Media o Esperanza
Varianza
Desviación tı́pica
v.a.discretas
µ ó E(X)
xi p(xi )
v.a. continuas
−∞ xf (x) dx
P
R∞
σ2
i
P
R∞
σ
i
r
P
qR
∞
(xi − µ)2 p(xi )
(xi − µ)2 p(xi )
i
−∞ (x
− µ)2 f (x) dx
−∞ (x
− µ)2 f (x) dx
42
Estadı́stica
Observación 3 La media de una variable aleatoria se interpreta como el valor esperado a largo plazo,
de la variable, de ahı́ su nombre de Esperanza.
En cuanto a las restantes medidas, se definen:
• Mediana:
- en el caso discreto se calcula de igual forma que para variables estadı́sticas.
- en el caso continuo, es el valor para el que F (x) = 21 .
• Moda:
- en el caso discreto, es el valor xi para el cuál p toma el valor más alto.
- en el caso continuo, coincide con los máximos absolutos de la función de densidad.
• Cuartiles:
- en el caso discreto se calculan de igual forma que para variables estadı́sticas.
- en el caso continuo son: Q1 el valor para el que F (x) = 14 y Q3 el valor para el que F (x) = 34 .
• Rango intercuartı́lico: en ambos casos se define como la diferencia entre los cuartiles, Q3 − Q1 .
• Coeficiente de variación: en ambos casos se define como
σ
µ.
Un resultado importante, que expresa la relación existente entre la media de una variable aleatoria
y su desviación tı́pica, es el teorema de Chebychev, cuyo enunciado es similar al visto en Estadı́stica
Descriptiva, y cuya demostración, en el caso discreto es análoga y por tanto, no la repetiremos:
Teorema 1 Teorema de Chebychev
Sea X una v.a. con media µ finita y desviación tı́pica σ finita. Entonces, si k es un número real con
1
k ≥ 1: p(µ − kσ ≤ X ≤ µ + kσ) > 1 − 2
k
3.5 Vectores aleatorios bidimensionales
Hasta ahora hemos estudiado las variables aleatorias unidimensionales, es decir, los valores de
una caracterı́stica aleatoria. En muchos casos, interesa estudiar dos o más caracterı́sticas y
su relación: peso y altura, renta y consumo, producción y gastos de mantenimiento, inversión
tecnológica y número de obreros,...
Por comodidad vamos a estudiar los vectores aleatorios bidimensionales, aunque el estudio de
variables n-dimensionales es análogo. Además, nos centraremos en los vectores discretos, aunque
definiremos de forma intuitiva el concepto de vector continuo y veremos algunas propiedades
comunes a ambos tipos de vectores.
Definición 7 Se denomina vector aleatorio bidimensional a una aplicación del espacio de
~ = (X, Y ) : Ω −→ IR2 .
sucesos de un experimento aleatorio en IR2 , X
Definición 8 Se dice que se ha definido la distribución conjunta del vector si se conocen:
(a) Los resultados posibles del vector (es decir, su soporte, que denotaremos por SX~ o por
S(X,Y ) ).
(b) Las probabilidades de cada resultado posible.
~ = (X, Y ) es discreto si sus dos
Definición 9 Diremos que un vector aleatorio bidimensional X
componentes son variables aleatorias discretas.
43
Estadı́stica
Ejemplo 1:
Se lanzan dos dados y se consideran las variables aleatorias:
X= suma de los resultados
Y= valor absoluto de la diferencia
En este caso, p(X ≤ 4, Y = 2) = p({(1, 3), (3, 1)}) = 1/18 y de igual forma se obtiene la
distribución conjunta p(X = xi , Y = yj ). Además, podemos obtener los valores de p(X = 2) ó
p(Y = 4), utilizando tablas de doble entrada:
Y \X
0
1
2
3
4
5
2
1/36
0
0
0
0
0
1/36
3
0
1/18
0
0
0
0
2/36
4
1/36
0
1/18
0
0
0
3/36
5
0
1/18
0
1/18
0
0
4/36
6
1/36
0
1/18
0
1/18
0
5/36
7
0
1/18
0
1/18
0
1/18
6/36
8
1/36
0
1/18
0
1/18
0
5/36
9
0
1/18
0
1/18
0
0
4/36
10
11
1/36 0
0
1/18
1/18 0
0
0
0
0
0
0
3/36 2/36
12
1/36
0
0
0
0
0
1/36
6/36
5/18
4/18
3/18
2/18
1/18
También podemos considerar la variable X/(Y ≤ 2), cuyo soporte es {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
y cuya distribución de probabilidades viene dada por:
X/(Y ≤ 2)
2
p(X = xi /Y ≤ 2) 1/24
3
4
5
6
7
2/24 3/24 4/24 5/24 6/24
8
5/24
9
4/24
10
3/24
11
2/24
12
1/24
Vector aleatorio continuo
Dijimos al principio que comentarı́amos el concepto de vector continuo; de forma intuitiva un
par de variables aleatorias (X,Y) definen un vectr continuo si existe una función de dos variables
f (x, y), positiva, ”que determina un volumen unidad en IR2 ” y de forma que la probabilidad
de que el vector tome valores en un subconjunto de IR2 es el volumen que esa función f (x, y)
determina sobre él. Si el vector es continuo, cada una de sus componentes X e Y son variables
aleatorias continuas y por tanto tienen funciones de densidad que denotaremos por fX y fY .
4.6 Independencia de variables aleatorias
Definición 10 Las v.a discretas X1 , X2 , . . . Xn se dicen independientes si y sólo si p(X1 =
x1 , X2 = x2 , . . . Xn = xn ) = pX1 (x1 )pX2 (x2 ) . . . pXn (xn ) para cada (x1 , . . . , xn ) ∈ S(X1 ,X2 ,...,Xn ) .
Ejemplo 3:
Puede comprobarse que las variables X e Y definidas en el ejemplo 1 no son independientes.
Ejemplo 4:
En el experimento de tirar dos dados correctos, vamos a definir las variables X1 y X2 de la
siguiente forma:
X1 = 2 si al menos uno de los resultados es par y X1 = 1 si los dos resultados son impares
X2 = 3 si al menos un resultado es múltiplo de 3 y X2 = 0 si ninguno de los dos resultados es
múltiplo de 3.
Puede comprobarse que la tabla de doble entrada del vector (X1 , X2 ) es :
44
Estadı́stica
X1 \X2
1
2
0
3
4/36 5/36 9/36
12/36 15/36 27/36
16/36 20/36
Las variables X1 y X2 son independientes, puesto que
9 20
36 36
=
5
36
9 16
36 36
=
4
36
27 20
36 36
=
15
36
27 16
36 36
=
12
36
Definición 11 El vector aleatorio continuo (X1 , . . . , Xn ) tiene componentes que son independientes
si y sólo si f (x1 , x2 , . . . , xn ) = fX1 (x1 ) . . . fXn (xn ) .
4.7 Funciones de vectores aleatorios
En ocasiones, los sucesos a estudiar se expresan como una relación funcional de variables
aleatorias (por ejemplo, el suceso X + Y ≤ 1, ó XY ≥ 62.5). Por ello, vamos a introducir
brevemente las funciones de vectores aleatorios.
Proposición 1 Si (X,Y) es un vector aleatorio y h : IR2 7−→ IR es una función continua,
entonces h(X,Y) es una variable aleatoria que, si el vector es continuo, será continua.
Algunas de las relaciones que más comúnmente aparecen al trabajar con variables aleatoria es
la suma y el producto; las medidas de las nuevas variables, cumplen estas propiedades:
Propiedades 3 Si (X,Y) es un vector aleatorio bidimensional y a,b son números reales:
(a) E(aX + bY ) = aE(X) + bE(Y ).
(b) Si X e Y son independientes: V ar(aX + bY ) = a2 V ar(X) + b2 V ar(Y ).
(c) Si X e Y son independientes: E(aXY ) = aE(X)E(Y ).

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Download Tema 3: Variables aleatorias y vectores aleatorios bidimensionales