Download VARIABLE ALEATORIA

Document related concepts
no text concepts found
Transcript
Probabilidad y Estadística
11
Probabilidad y distribuciones de probabilidad discretas
VARIABLE ALEATORIA
Según vimos el concepto de probabilidad se define para eventos asociados al espacio
muestral de un experimento. Los elementos del espacio muestral pueden ser de naturaleza muy
diversa: letras, números, pares de números, sucesiones, etc.. Ahora bien, en muchas situaciones
resulta más adecuado trabajar con eventos numéricos, esto es con eventos que pueden ser
descriptos mediante subconjuntos de números. Con este fin se introduce el concepto de variable
aleatoria. Este concepto permite “mirar” los eventos como eventos numéricos.
Variable aleatoria. Sea S el espacio muestral asociado a un experimento. Una variable
aleatoria es una función real X definida sobre S, es decir,
X : S  IR
Según la definición anterior, una variable aleatoria lo que hace es asignar un valor
numérico a cada elemento del espacio muestral.
Ejemplo. El experimento consiste en tirar una moneda.
S = {cara, seca}
Se puede definir X : S  IR dada por X(cara) = 1, X(seca) = 0.
Ejemplo. El experimento consiste en tirar dos monedas distinguibles (por ejemplo, de distinto
valor).
S = {(cara, cara), (cara, seca), (seca, cara), (seca, seca)}
donde por ejemplo el par (cara, seca) significa que salió cara en la primer moneda y seca en la
segunda.
Se puede considerar la variable aleatoria
X : S  IR dada por X((s1, s2)) = cantidad de caras en (s1, s2),
es decir,
X(cara, cara) = 2, X(cara, seca) = 1, X(seca, cara) = 1, X(seca, seca) = 0.
También se podría definir la variable aleatoria Y : S  IR dada por
Y((s1, s2)) = 1 si s1 y s2 son caras
Y((s1, s2)) = 0 en otro caso
es decir,
Y(cara, cara) = 1, Y(cara, seca) = 0, Y(seca, cara) = 0, Y(seca, seca) = 0.
El como se defina la variable aleatoria para un experimento dado dependerá de lo que se
quiera estudiar.
Las variables aleatorias se clasifican en discretas y continuas.
Variable aleatoria discreta. Una variable aleatoria X se dice discreta si sólo puede tomar un
número finito o infinito numerable de valores distintos.
Variable aleatoria continua. Una variable aleatoria X se dice continua si toma cualquier valor
en un intervalo.
Las variables aleatorias continuas las estudiaremos en la próxima clase.
Probabilidad y Estadística
12
Probabilidad y distribuciones de probabilidad discretas
Los ejemplos considerados anteriormente son ejemplos de variables aleatorias discretas
pues los valores que pueden tomar son {0, 1}, {0, 1, 2} y {0, 1} respectivamente. Veamos otros
ejemplos,
Ejemplo. El experimento consiste en tirar una moneda 10 veces.
S = {(s1, ..., s10) : si es cara o seca}
S consta de todas las 10uplas de caras y secas
Definamos la variable aleatoria X : S  IR,
X(s1, ..., s10) = cantidad de caras en (s1, ..., s10)
que asigna a cada 10upla la cantidad de caras que tiene. Luego los valores que puede tomar X
son {0, 1, ..., 10}.
Ejemplo. El experimento consiste en tirar una moneda infinitas veces.
S = {(s1, s2, s3,...) : si es cara o seca}
S consta de todas las sucesiones de caras y secas
Definamos la variable aleatoria X : S  IR
X(s1, s2, s3,...) = i tal que si es la primer cara.
que asigna a cada sucesión el lugar en el que aparece la primer cara. Luego los valores que
puede tomar X son {1, 2, ...} = IN.



Algunas otras situaciones concretas donde aparecen variables aleatorias discretas son:
Si se estudia la eficacia de un fármaco para controlar el crecimiento de bacterias: número de
bacterias por unidad de área determinado a intervalos de 5 hs..
Número de computadoras defectuosas en envíos mensuales de 100 unidades a lo largo de un
año.
Número de pedidos semanales nuevos en una planta manufacturera durante un año.
DISTRIBUCIÓN
DISCRETA.
DE
PROBABILIDAD
DE
UNA
VARIABLE
ALEATORIA
Antes de seguir vamos a hacer un comentario acerca de la notación.
Si X denota una variable aleatoria, entonces x denotará un valor cualquiera de esta
variable.
Por ejemplo, si el experimento consiste en tirar una moneda, entonces
S = {cara, seca}
Si X : S  IR está dada por X(cara) = 1, X(seca) = 0, entonces x va a denotar
cualquiera de los valores 0 o 1.
Si la variable aleatoria se denota con Y, entonces y denotará un valor cualquiera de esta
variable.
Cuando se usan variables aleatorias para estudiar problemas estadísticos resulta de
interés calcular cuando se realiza el experimento asociado a X una vez, por ejemplo:
la probabilidad de que dicha variable toma algún valor determinado
P(X = x) = P( {s  S : X(s) = x} )
la probabilidad de que su valor sea menor o igual que determinado número
Probabilidad y Estadística
13
Probabilidad y distribuciones de probabilidad discretas
P(X  x) = P( {s  S : X(s)  x} )
la probabilidad de que su valor caiga dentro de ciertos límites
P(x1  X  x2) = P( {s  S : x1  X(s)  x2} )
.
Ejemplo. Consideremos el experimento que consiste en tirar dos dados balanceados
distinguibles, por ejemplo, uno negro y otro blanco.
Si, por ejemplo, el par (1, 2) significa que salió 1 en el dado negro y 2 en el blanco,
S = {(1, 1), (1, 2), ..., (1, 6), (2,1), (2, 2), ..., (2, 6), ..., (6,1), (6, 2), ..., (6, 6))},
S consta de todos los pares ordenados cuyas componentes toman cualquier valor entre 1 y 6.
Como los dados son balanceados podemos considerar la distribución de igual
probabilidad. Como S tiene 36 elementos cada evento simple tendrá probabilidad 1/36
P({(i, j)}) = P(i, j) = 1/36.
Consideremos la variable aleatoria
X : S  IR
definida por
X(i, j) = i + j
suma de las componentes de (i, j)
Podemos calcular la probabilidad de que tome el valor 4, esto es
P(X = 4) = P( { (s1, s2)  S : X(s1, s2) = 4 } )
Como X toma el valor 4 para (1, 3), (2, 2), (3, 1)
P(X = 4) = P( { (1, 3), (2, 2), (3, 1) } ) = 3 / 36 = 1 / 12.
Podemos ahora calcular la probabilidad de que su valor esté entre 10 y 12, esto es
P(10  X  12) = P( { (s1, s2)  S : 10  X(s1, s2)  12 } )
= P( { (4, 6), (5, 5), (5, 6), (6, 4), (6, 5), (6, 6)) } )
= 6 / 36 = 1 / 6.
Como vemos estas probabilidades asociadas a variables aleatorias se calculan en
función de probabilidades asociadas a eventos que corresponden al experimento. Sin embargo,
es posible definir directamente probabilidades para los valores de la variable aleatoria.
Distribución de probabilidad de una variable aleatoria discreta.
La distribución de probabilidad de una variable aleatoria discreta X es una fórmula, una tabla o
una gráfica que proporciona la probabilidad p(x) asociada a cada valor x, es decir,
p(x) = P(X = x) (la probabilidad de que X tome el valor x).
Los valores p(x) cumplen,
1. 0  p(x)  1.
2.
p(x) = 1

toda x
Probabilidad y Estadística
14
Probabilidad y distribuciones de probabilidad discretas
Ya vimos en el ejemplo anterior cómo puede determinarse p(x) a partir de la distribución de
probabilidad P correspondiente al experimento al cual se asocia X. Veamos ahora otro ejemplo,
Ejemplo. El experimento consiste en tirar dos monedas distinguibles.
S = {(cara, cara), (cara, seca), (seca, cara), (seca, seca)}
Consideremos la variable aleatoria X : S  IR está dada por
X((s1, s2)) = cantidad de caras en (s1, s2),
es decir,
X(cara, cara) = 2, X(cara, seca) = 1, X(seca, cara) = 1, X(seca, seca) = 0.
Los eventos simples son
{(cara, cara)}
{(cara, seca)}
{(seca, cara)}
{(seca, seca)}
Si las monedas están bien balanceadas podemos usar la distribución de igual
probabilidad. Como #S = 4, cada uno de los eventos simples tiene probabilidad 1/4, de donde:
Distribución de probabilidad P.
Evento simple
{(cara, cara)}
{(cara, seca)}
{(seca, cara)}
{(seca, seca)}
Probabilidad
1/4
1/4
1/4
1/4
Para determinar p(x) = P(X = x) procedemos como en el ejemplo anterior.
P(X = 0) = P({(seca, seca)}) = 1/4, entonces p(0) = 1/4.
P(X = 1) = P({(cara, seca), (seca, cara)}) = 2/4 = 1/2, entonces p(0) = 1/2.
P(X = 2) = P({(cara, cara)}) = 1/4, entonces p(0) = 1/4.
Tabla de la distribución de probabilidad para X
X
Eventos
0
{(seca, seca)}
1
{(cara, seca), (seca, cara)}
2
{(cara, cara)}
p(x)
1/4
2/4 = 1/2
1/4
p(0) + p(1) + p(2) = 1
En la primer columna aparecen los valores que puede tomar X. En la segunda columna
los eventos con los elementos del espacio muestral para los cuales X toma cada uno de sus
valores.
Se usó la distribución de igual probabilidad basándonos en que las monedas estaban
bien balanceada. Si se interpreta p(x) usando la definición a posteriori, p(x) es la frecuencia
relativa con la que aparece x si se repite el experimento un número grande de veces. Es decir, si
se tira las monedas se tiran un número grande de veces y se calcula el valor de X en cada tirada
se obervaría
X toma el valor 0, 1/4 de las veces
X toma el valor 1, 1/2 de las veces
X toma el valor 2, 1/4 de las veces
Probabilidad y Estadística
15
Probabilidad y distribuciones de probabilidad discretas
de donde la tabla anterior (sin la 2da. columna) es una tabla de frecuencias relativas y el
histograma de frecuencias relativas asociado es
Como se hace con cualquier distribución de frecuencias relativas, para la distribución de
probabilidad de una variable aleatoria se pueden considerar entonces las medidas descriptivas
numéricas como la media, variancia y desviación estándar.
Valor esperado de X. Sea X una variable aleatoria discreta con una distribución de
probabilidad p(x). El valor esperado de X es
E(X) =
xp( x)

x
Ejemplo. Para el ejemplo anterior, p(0) = 1/4, p(1) = 1/2 y p(2) = 1/4, entonces
E(X) = 0
1
1
1
+1 +2
= 1.
4
2
4
Observación. La media es un promedio de los datos. Este promedio también puede calcularse
sumando lo productos de cada dato por la frecuencia relativa correspondiente. Así, si  es la
media de la distribución de frecuencia relativa de la población correspondiente a la distribución
de probabilidad p(x), entonces
E(X) = .
Probabilidad y Estadística
16
Probabilidad y distribuciones de probabilidad discretas
Variancia y desviación estándar.
La variancia de una variable aleatoria X es el valor esperado de (X  )2, es decir,
2 = E(X  )2 =
( x   ) 2 p ( x)

x
La desviación estándar  es la raíz cuadrada de 2.
Ejemplo. Para el ejemplo anterior, p(0) = 1/4, p(1) = 1/2, p(2) = 1/4,  = E(X) = 1, entonces
2 =
( x   ) 2 p ( x)

x
= (0  1)2 p(0) + (1  1)2 p(1) + (2  1)2 p(2)
=1
1
1
1
1
+0
+1
0= .
2
4
2
4
Observación. Se definió la variancia como el promedio o media de los cuadrados de las
diferencias entre los datos y la media . Como la media corresponde a la esperanza de una
variable aleatoria, se obtiene la fórmula anterior para la variancia.