Download 1. Variables aleatorias

Document related concepts
no text concepts found
Transcript
Variables aleatorias
Universidad de Puerto Rico
ESTA 3041
Prof. Héctor D. Torres Aponte
1.
Variables aleatorias
Definición 1.1. Una variable aleatoria es una variable cuyo valor es un “outcome” numérico
de algún evento aleatorio.
Ejemplo 1.1. Sea X el número de caras. Si su “outcome” es HT T H entonces X = 2. Los
posibles valores para X son 1, 2, 3, 4. Si lanzamos la moneda 4 veces mas, los valores de X
cambian. Note que X es una variable aleatoria.
Existen dos tipos de variables aleatorias: discreta y continua. En variables aleatorias
cuando nos referimos a discreto y continuo lo usamos en el mismo contexto que lo usabamos
anteriormente (material del primer examen). Estas variables aleatoria tienen una probabilidad y a esto se le conoce como distribución de probabilidad.
Definición 1.2. La distribución de probabilidad de la variable aleatoria X, nos indica que
valores de X podemos obtener y con que probabilidad ocurren estos valores.
1.1.
Variables Aleatorias Discretas
Definición 1.3. La distribución de probabilidad de una variable aleatoria discreta X nos
enlista todos los posibles valores de X y su probabilidad, de tal forma podemos obtener la
siguiente tabla:
Valor de X
P (x)
x1
p1
x2
p2
···
···
xk
pk
Los valores pi tienen que cumplir lo siguiente:
1. 0 ≤ pi ≤ 1
Pk
2.
i=1 = 1
Para encontrar la probabilidad de cualquier evento, sume todas las probabilidades pi de
los valores individuales xi .
Ejemplo 1.2. Considere que ciertos compradores de computadoras tienen la opción de escoger el disco duro (HDD) que estará instalada en su maquina, estos tienen las siguientes
opciones de tamaño: 10GB, 20GB, 30GB o 40GB. Suponga que seleccionamos a un cliente
al azar para preguntarle que tamaño de HDD prefiere para su selección de computadora.
Vemos que el tamaño del HDD es nuestra variable aleatoria. Las valores de X cambian
según se repita dicho valor:
1
Tamaño de HDD
Probabilidad
10
0.50
20
0.25
30
0.15
40
0.10
con esta tabla podemos hacer el siguiente histograma:
0.6
Probability
0.5
0.4
0.3
0.2
0.1
0.0
10
20
30
40
Outcome
La probabilidad de que un cliente seleccionado al azar prefiera al menos 30GB de HDD
es:
P (30 ∪ 40) = P (X = 30) + P (X = 40)
= 0.15 + 0.10
= 0.25
Ahora por ejemplo, considere que una moneda justa (ambas caras tienen el mismo peso)
es lanzada 4 veces. La variable aleatoria X es contar el número de caras. ¿Como encontramos
una distribución para X?. Un moedelo razonable para esto comenzarı́a diciendo que cada
una de las opciones tiene la misma probabilidad dado que es una moneda justa. Pero el
lanzarla 4 veces nos afecta este pensamiento.
Note que los posibles valores para X (# de caras) son 0, 1, 2, 3, 4. Estos no tienen la
misma probabilidad de ocurrir, un ejemplo claro de esto es cuando:
X = 0 implica a que nuestro “outcome” es T T T T , entonces P (X = 0) =
1
.
16
X = 2 esta opción ocurre 6 veces diferentes, entonces
cantidad de veces con 2 caras
16
6
3
=
=
16
8
P (X = 2) =
a continuación vemos una gráfica que explica cuales son las opciones por cada caso:
HT T T
T HT T
T T HT
TTTT TTTH
X=0
X=1
HT T H
HT HT
T HT H
HHT T
T HHT
T T HH
X=2
2
HHHT
HHT H
HT HH
T HHH HHHH
X=3
X=4
Vemos que existe 16 opciones en total. Ahora podemos calcular la probabilidad para cada
uno de los valores de X.
P (X = 0) =
P (X = 1) =
P (X = 2) =
P (X = 3) =
P (X = 4) =
1
16
4
16
6
16
4
16
1
16
= 0.0625
= 0.25
= 0.375
= 0.25
= 0.0625
Vemos que la suma de todas las probabilidades suman 1, ası́ que la probabilidad es legı́tima.
Entonces podemos hacer nuestra tabla de distribución de la siguiente manera:
Números de caras X
Probabilidad
0
0.625
1
0.25
2
0.375
3
0.25
4
0.625
Además podemos hacer un histograma y obtenemos:
0.4
Probability
0.3
0.2
0.1
0.0
0
1
2
Outcome
3
4
Ahora, ¿Cual es la probabilidad de obtener al menos dos caras? Para esto tenemos que
calcular P (X ≥ 2).
P (X ≥ 2) = P (X = 2) + P (X = 3) + P (X = 4)
= 0.375 + 0.25 + 0.0625
= 0.6825
Si nos interesa saber cual es la probabilidad de obtener al menos una cara entonces,
P (X ≥ 1) = 1 − P (X = 0)
= 1 − 0.0625
= 0.9375
3
1.2.
Variables aleatorias continuas
Definición 1.4. La distribución de probabilidad de una variable aleatoria continua es descrita por la curva de densidad. La probabilidad de un evento es el “área” bajo la curva.
Por ejemplo, considere que la vida útil X de una llanta de 40,000 millas tiene una distribución Normal con µ = 50, 000 y σ = 5, 500. Esto se resume utilizando la siguiente notación,
X ∼ N (50000, 5500), donde el sı́mbolo “∼” significa distribuye. La probabilidad de que una
llanta seleccionada al azar tenga una vida útil menor de 40,000 millas es:
40, 000 − 50, 000
X − 50, 000
<
P (X < 40, 000) = P
550
5, 500
= P (Z < −1.82)
= 0.0344
Esto se puede representar con la siguiente gráfica:
Area =
0.0344
30,000
1.3.
40,000
50,000
60,000
70,000
La media de una variable aleatoria
La media x̄ de un conjunto de observaciones es el promedio aritmético. Esta es diferente
a la media de una variable aleatoria X. La media de una variable aleatoria X es también el
promedio de todos los posibles valores de X, pero tenemos que considerar que no todas las
opciones son igualmente posibles.
Ejemplo 1.3. Suponga que estamos interesados en jugar “Pega 3”. Para esto se escogen 3
números, si el número escogido es acertado ganamos $500. Tenemos que notar que existen
1,000 posibles combinaciones de números, desde 000,...,999. Sea X la cantidad de dinero que
ganamos, la distribución de probabilidad para X es:
Pago de X
Probabilidad
$0
0.999
4
$500
0.001
¿Cual es el pago promedio al jugar muchas combinaciones de números? Si tomamos la media
aritmética obtenemos 0+500
= $250. Pero esto no hace sentido porque ganar $500 es mucho
2
menos probable que ganar $0. Pero note que uno gana $500 utilizando una sola combinación
de números y $0 con el restante 999 combinaciones de números. Ahora si decimos que:
$500
999
1
+ $0
= $0.50
1000
1000
Esta es la media de la variable aleatoria. Lo que quiere decir que a muchas jugadas el estado
se queda con $0.50 de cada dolar apostado.
Definición 1.5. Suponga que X es una variable aleatoria discreta cuya distribución es:
Valor de X
Probabilidad
x1
p1
x2
p2
···
···
xk
pk
la media de la variable aleatoria X que también se le conoce como el valor esperado se
define como
k
X
µ X = x1 p 1 + x2 p 2 + · · · xk p k =
xi p i
i=1
Ahora, considere el ejemplo de el generador de números aleatorios. Si X es una variable aleatoria identicamente distribuida (todas las opciones tienen la misma probabilidad)
entonces tenemos la siguiente tabla de distribución:
Primer dı́gito X
Probabilidad
1
2
3
4
5
6
7
8
9
1
9
1
9
1
9
1
9
1
9
1
9
1
9
1
9
1
9
El valor esperado de X es:
1
1
1
1
1
1
1
1
1
+2× +3× +4× +5× +6× +7× +8× +9×
9
9
9
9
9
9
9
9
9
1
= 45 × = 5
9
µX = 1 ×
Ahora, considere el mismo ejemplo pero en este caso utilizando la ley de Benford para
números aleatorios. Sea V un número aleatorio, utilizando la ley de Benford obtenemos la
siguiente tabla de distribución:
Primer dı́gito V
Probabilidad
1
0.301
2
0.176
3
0.125
4
0.097
5
0.079
6
0.067
7
0.058
8
0.051
9
0.046
Entonces tenemos que el valor esperado para la variable aleatoria V es:
µV
= 1 (0.301) + 2 (0.176) + 3 (0.125) + · · · + 8 (0.051) + 9 (0.046)
= 3.441
Si hacemos un histograma para cada variable aleatoria X y V marcando en este µX y µV
respectivamente obtenemos los siguientes gráficos:
5
Probability
0.4
0.3
0.2
0.1
0.0
0
1
2
3
4
5
Outcomes
6
7
8
9
6
7
8
9
(a)
Probability
0.4
0.3
0.2
0.1
0.0
0
1
2
3
4
5
Outcomes
(b)
6