Download 1. Variables aleatorias
Document related concepts
no text concepts found
Transcript
Variables aleatorias Universidad de Puerto Rico ESTA 3041 Prof. Héctor D. Torres Aponte 1. Variables aleatorias Definición 1.1. Una variable aleatoria es una variable cuyo valor es un “outcome” numérico de algún evento aleatorio. Ejemplo 1.1. Sea X el número de caras. Si su “outcome” es HT T H entonces X = 2. Los posibles valores para X son 1, 2, 3, 4. Si lanzamos la moneda 4 veces mas, los valores de X cambian. Note que X es una variable aleatoria. Existen dos tipos de variables aleatorias: discreta y continua. En variables aleatorias cuando nos referimos a discreto y continuo lo usamos en el mismo contexto que lo usabamos anteriormente (material del primer examen). Estas variables aleatoria tienen una probabilidad y a esto se le conoce como distribución de probabilidad. Definición 1.2. La distribución de probabilidad de la variable aleatoria X, nos indica que valores de X podemos obtener y con que probabilidad ocurren estos valores. 1.1. Variables Aleatorias Discretas Definición 1.3. La distribución de probabilidad de una variable aleatoria discreta X nos enlista todos los posibles valores de X y su probabilidad, de tal forma podemos obtener la siguiente tabla: Valor de X P (x) x1 p1 x2 p2 ··· ··· xk pk Los valores pi tienen que cumplir lo siguiente: 1. 0 ≤ pi ≤ 1 Pk 2. i=1 = 1 Para encontrar la probabilidad de cualquier evento, sume todas las probabilidades pi de los valores individuales xi . Ejemplo 1.2. Considere que ciertos compradores de computadoras tienen la opción de escoger el disco duro (HDD) que estará instalada en su maquina, estos tienen las siguientes opciones de tamaño: 10GB, 20GB, 30GB o 40GB. Suponga que seleccionamos a un cliente al azar para preguntarle que tamaño de HDD prefiere para su selección de computadora. Vemos que el tamaño del HDD es nuestra variable aleatoria. Las valores de X cambian según se repita dicho valor: 1 Tamaño de HDD Probabilidad 10 0.50 20 0.25 30 0.15 40 0.10 con esta tabla podemos hacer el siguiente histograma: 0.6 Probability 0.5 0.4 0.3 0.2 0.1 0.0 10 20 30 40 Outcome La probabilidad de que un cliente seleccionado al azar prefiera al menos 30GB de HDD es: P (30 ∪ 40) = P (X = 30) + P (X = 40) = 0.15 + 0.10 = 0.25 Ahora por ejemplo, considere que una moneda justa (ambas caras tienen el mismo peso) es lanzada 4 veces. La variable aleatoria X es contar el número de caras. ¿Como encontramos una distribución para X?. Un moedelo razonable para esto comenzarı́a diciendo que cada una de las opciones tiene la misma probabilidad dado que es una moneda justa. Pero el lanzarla 4 veces nos afecta este pensamiento. Note que los posibles valores para X (# de caras) son 0, 1, 2, 3, 4. Estos no tienen la misma probabilidad de ocurrir, un ejemplo claro de esto es cuando: X = 0 implica a que nuestro “outcome” es T T T T , entonces P (X = 0) = 1 . 16 X = 2 esta opción ocurre 6 veces diferentes, entonces cantidad de veces con 2 caras 16 6 3 = = 16 8 P (X = 2) = a continuación vemos una gráfica que explica cuales son las opciones por cada caso: HT T T T HT T T T HT TTTT TTTH X=0 X=1 HT T H HT HT T HT H HHT T T HHT T T HH X=2 2 HHHT HHT H HT HH T HHH HHHH X=3 X=4 Vemos que existe 16 opciones en total. Ahora podemos calcular la probabilidad para cada uno de los valores de X. P (X = 0) = P (X = 1) = P (X = 2) = P (X = 3) = P (X = 4) = 1 16 4 16 6 16 4 16 1 16 = 0.0625 = 0.25 = 0.375 = 0.25 = 0.0625 Vemos que la suma de todas las probabilidades suman 1, ası́ que la probabilidad es legı́tima. Entonces podemos hacer nuestra tabla de distribución de la siguiente manera: Números de caras X Probabilidad 0 0.625 1 0.25 2 0.375 3 0.25 4 0.625 Además podemos hacer un histograma y obtenemos: 0.4 Probability 0.3 0.2 0.1 0.0 0 1 2 Outcome 3 4 Ahora, ¿Cual es la probabilidad de obtener al menos dos caras? Para esto tenemos que calcular P (X ≥ 2). P (X ≥ 2) = P (X = 2) + P (X = 3) + P (X = 4) = 0.375 + 0.25 + 0.0625 = 0.6825 Si nos interesa saber cual es la probabilidad de obtener al menos una cara entonces, P (X ≥ 1) = 1 − P (X = 0) = 1 − 0.0625 = 0.9375 3 1.2. Variables aleatorias continuas Definición 1.4. La distribución de probabilidad de una variable aleatoria continua es descrita por la curva de densidad. La probabilidad de un evento es el “área” bajo la curva. Por ejemplo, considere que la vida útil X de una llanta de 40,000 millas tiene una distribución Normal con µ = 50, 000 y σ = 5, 500. Esto se resume utilizando la siguiente notación, X ∼ N (50000, 5500), donde el sı́mbolo “∼” significa distribuye. La probabilidad de que una llanta seleccionada al azar tenga una vida útil menor de 40,000 millas es: 40, 000 − 50, 000 X − 50, 000 < P (X < 40, 000) = P 550 5, 500 = P (Z < −1.82) = 0.0344 Esto se puede representar con la siguiente gráfica: Area = 0.0344 30,000 1.3. 40,000 50,000 60,000 70,000 La media de una variable aleatoria La media x̄ de un conjunto de observaciones es el promedio aritmético. Esta es diferente a la media de una variable aleatoria X. La media de una variable aleatoria X es también el promedio de todos los posibles valores de X, pero tenemos que considerar que no todas las opciones son igualmente posibles. Ejemplo 1.3. Suponga que estamos interesados en jugar “Pega 3”. Para esto se escogen 3 números, si el número escogido es acertado ganamos $500. Tenemos que notar que existen 1,000 posibles combinaciones de números, desde 000,...,999. Sea X la cantidad de dinero que ganamos, la distribución de probabilidad para X es: Pago de X Probabilidad $0 0.999 4 $500 0.001 ¿Cual es el pago promedio al jugar muchas combinaciones de números? Si tomamos la media aritmética obtenemos 0+500 = $250. Pero esto no hace sentido porque ganar $500 es mucho 2 menos probable que ganar $0. Pero note que uno gana $500 utilizando una sola combinación de números y $0 con el restante 999 combinaciones de números. Ahora si decimos que: $500 999 1 + $0 = $0.50 1000 1000 Esta es la media de la variable aleatoria. Lo que quiere decir que a muchas jugadas el estado se queda con $0.50 de cada dolar apostado. Definición 1.5. Suponga que X es una variable aleatoria discreta cuya distribución es: Valor de X Probabilidad x1 p1 x2 p2 ··· ··· xk pk la media de la variable aleatoria X que también se le conoce como el valor esperado se define como k X µ X = x1 p 1 + x2 p 2 + · · · xk p k = xi p i i=1 Ahora, considere el ejemplo de el generador de números aleatorios. Si X es una variable aleatoria identicamente distribuida (todas las opciones tienen la misma probabilidad) entonces tenemos la siguiente tabla de distribución: Primer dı́gito X Probabilidad 1 2 3 4 5 6 7 8 9 1 9 1 9 1 9 1 9 1 9 1 9 1 9 1 9 1 9 El valor esperado de X es: 1 1 1 1 1 1 1 1 1 +2× +3× +4× +5× +6× +7× +8× +9× 9 9 9 9 9 9 9 9 9 1 = 45 × = 5 9 µX = 1 × Ahora, considere el mismo ejemplo pero en este caso utilizando la ley de Benford para números aleatorios. Sea V un número aleatorio, utilizando la ley de Benford obtenemos la siguiente tabla de distribución: Primer dı́gito V Probabilidad 1 0.301 2 0.176 3 0.125 4 0.097 5 0.079 6 0.067 7 0.058 8 0.051 9 0.046 Entonces tenemos que el valor esperado para la variable aleatoria V es: µV = 1 (0.301) + 2 (0.176) + 3 (0.125) + · · · + 8 (0.051) + 9 (0.046) = 3.441 Si hacemos un histograma para cada variable aleatoria X y V marcando en este µX y µV respectivamente obtenemos los siguientes gráficos: 5 Probability 0.4 0.3 0.2 0.1 0.0 0 1 2 3 4 5 Outcomes 6 7 8 9 6 7 8 9 (a) Probability 0.4 0.3 0.2 0.1 0.0 0 1 2 3 4 5 Outcomes (b) 6