Download Capítulo 3 Introducción a la Probabilidad
Document related concepts
no text concepts found
Transcript
Capítulo 3 Introducción a la Probabilidad Para extender los resultados del estudio descriptivo de las variables estadísticas a poblaciones que no se observan completamente, es necesario utilizar la idea de modelo probabilístico. En esta parte, se introduce, en primer lugar, la noción de probabilidad como idealización del concepto de frecuencia relativa. A continuación se presenta la probabilidad condicionada y la definición de independencia. El concepto básico para la construcción de modelos probabilísticos es el de variable aleatoria; el estudio que aquí se realiza es paralelo al que se ha hecho en la primera parte con las variables estadísticas, considerándose su distribución de probabilidad, su media (o valor esperado), varianza, etc. Esta parte finaliza con el estudio de algunas distribuciones de probabilidad bien conocidas. 3.1 Experimentos aleatorios. Sucesos. Hay que distinguir entre dos tipos de experimentos o fenómenos: aleatorios y determinísticos. Los fenómenos determinísticos son los que obedecen a una relación causa-efecto y al variar poco las causas varía poco el efecto. Los fenómenos aleatorios se caracterizan porque al repetirse en condiciones análogas presentan resultados impredecibles de antemano. El objetivo del Cálculo de Probabilidades es el estudio de métodos de análisis del comportamiento de fenómenos aleatorios. 1 El primer paso para estudiar un experimento aleatorio es registrar todos sus posibles resultados. Al conjunto de todos los posibles resultados de un experimento se le llama espacio muestral y lo denotamos por Ω. Puede estar formado por un número finito o infinito de valores. Ejemplo 3.1: - Lanzamiento de un dado: Ω = {1, 2, ..., 6}, - Lanzamiento de dos monedas: Ω = {(c, c), (c, +), (+, c), (+, +)}, - Medición del tiempo entre dos ingresos consecutivos en un hospital: Ω = R+ Un evento o suceso es un conjunto de resultados del espacio muestral. Si está formado por un único elemento se dice elemental. Los denotaremos con letras, A, B, C, etc. Ejemplo 3.2: - A=En el lanzamiento del dado se obtiene un número par ={2,4,6} - B=En una muestra de 3 individuos con cáncer hay al menos uno que fallece durante un determinado intervalo de tiempo.={(F,no F, no F), (no F, F, no F), (no F, no F, F), (F, F, no F), (F, no F, F), (no F, F, F), (F, F, F)}. La letra F denota fallecimiento. Si el suceso contiene todos los resultados del espacio muestral se dice suceso seguro, ya que ocurre siempre. Si no contiene ningún resultado del espacio muestral se dice suceso imposible o nulo. Lo denotamos por ∅. Dados dos sucesos A y B, podemos realizar las siguientes operaciones: • Suceso A ∪ B : está formado por la unión de resultados de A y B. Ocurre si ocurre A o B (o ambos). • Suceso A ∩ B : está formado por los resultados comunes de A y B. Ocurre siempre que ocurran A y B simultáneamente. Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén. • A y B son incompatibles, mutuamente excluyentes o disjuntos si no pueden ocurrir simultáneamente, A ∩ B = ∅. • Si cualquier resultado de A es también resultado de B, entonces A está contenido en B, A ⊂ B. − • A es el suceso complementario de A si ocurre siempre que no ocurre A, − − A = Ω − A, A ∩ A = ∅. − − − − − − • Leyes de Morgan: A ∪ B = A ∩ B, A ∩ B = A ∪ B. Ejemplo 3.3: Sobre el ejemplo anterior, referente a individuos con cáncer, consideremos ahora los siguientes sucesos: -A: el primer individuo fallece -B : el segundo individuo fallece -C: el tercer individuo fallece A partir ellos obtenemos la expresión de los siguientes: -Los tres individuos fallecen: A ∩ B ∩ C − -Sólo los dos primeros fallecen: A ∩ B ∩ C -Alguno de los individuos fallece: A ∪ B ∪ C − − − -Ninguno de los individuos fallece: A ∩ B ∩ C, contrario del anterior. 3.2 Interpretaciones de la probabilidad 3.2.1 Definición clásica Sea Ω un espacio muestral finito con n elementos. La probabilidad de cada 1 elemento es la misma, igual a (espacio equiprobable). Se define la probabilidad n de un suceso A como: P (A) = Número de casos favorables a A (en Ω) Número de casos posibles Por ejemplo, la probabilidad de que al lanzar un dado se obtenga un no par 3 1 es = , ya que la probabilidad de obtener cada uno de los resultados es la 6 2 misma e igual a 1/6. Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén. En general, la probabilidad de un suceso es la suma de las probabilidades de sus elementos. Si el espacio muestral es equiprobable, la expresión es la dada anteriormente. 3.2.2 Definición frecuentista Si un experimento se repite n veces y nA resultados son favorables a un suceso A, el límite cuando n es suficientemente grande (n− > ∞) se toma como probabilidad de A. Esta definición relaciona probabilidad con frecuencia relativa. P (A) = lim n−>∞ nA n Por ejemplo, si lanzamos una moneda 5 veces y en esas 5 veces se obtienen 4 caras, no podemos decir que la probabilidad de obtener una cara en un lanzamiento es 4/5. Sin embargo, si lanzamos la moneda un número de veces suficientemente grande los resultados se van estabilizando, 28 50 60 , ..., 100 − > 12 . 3.2.3 Definición axiomática (Kolmogorov) Se llama función de probabilidad a una aplicación P : Ω −→ R A −→ P (A) tal que: (i) P (A) ≥ 0, ∀A ⊂ Ω (ii) P (Ω) = 1 (iii) Para toda sucesión de sucesos disjuntos dos a dos, {A1 , A2, ...} tales que Ai ∩ Aj = ∅ ∀i 6= j, entonces Ã∞ ! ∞ [ X Ai = P (Ai ) P i=1 i=1 En consecuencia se obtienen las propiedades de la probabilidad: Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén. (i) P (∅) = 0 − (ii) P (A) = 1 − P (A) (iii) 0 ≤ P (A) ≤ 1 (iv) Si A ⊂ B, P (A) ≤ P (B) (v) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) 3.4 Probabilidad condicionada Hasta ahora hemos visto el concepto de probabilidad partiendo de que la única información que tenemos sobre el experimento es el espacio muestral. Sin embargo, en ocasiones se conoce que un determinado suceso ha ocurrido. ¿Modificará esta información adicional la probabilidad de que ocurra otro suceso?. Veremos que generalmente sí. Definimos a continuación formalmente la probabilidad condicionada. - Probabilidad de A condicionada a B, P (A/B): probabilidad de que ocurra A si ha ocurrido B P (A/B) = P (A ∩ B) , P (B) 6= 0 P (B) - Probabilidad de B condicionada a A, P (B/A) : probabilidad de que ocurra B si ha ocurrido A P (B/A) = P (A ∩ B) , P (A) 6= 0 P (A) Si despejamos en ambas se obtiene que: P (A ∩ B) = P (A)P (B/A) = P (B)P (A/B) A esta expresión se le conoce como regla de la multiplicación, que en general para un número k de sucesos viene dada por: P (A1 ∩ A2 ∩ ... ∩ Ak ) = P (A1 )P (A2 /A1 )....P (Ak /A1 ∩ A2 ∩ ... ∩ Ak−1 ) Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén. 3.5 Independencia de sucesos Sean A y B dos sucesos del espacio muestral. El suceso A se dice independiente del suceso B si el conocimiento de la ocurrencia de B no modifica la probabilidad de aparición de A, es decir, si P (A/B) = P (A) En consecuencia, P (A ∩ B) = P (B)P (A/B) = P (B)P (A) y P (B/A) = P (B)P (A) = P (B), P (A) por lo que también B es independiente de A. Diremos entonces que A y B son sucesos independientes. Ejemplo 3.4: La proporción de alcohólicos en una determinada población es aproximadamente de un 10%; no obstante, en las bajas que dan los médicos de la Seguridad Social difícilmente se encuentra el diagnóstico de alcoholismo. Aparecen sin embargo diagnosticados de hepatopatías, lumbalgias, etc., que pueden hacer sospechar de alcoholismo subyacente. Se realizó un estudio sobre 1000 individuos, clasificados en la siguiente tabla según presenten o no realmente alcoholismo y según les hayan sido diagnosticadas o no tales patologías. Denotamos por A al suceso "ser alcohólico", y por P T al suceso "presentar tales patologías". − PT PT Total 85 15 100 A 63 837 900 Total 148 852 1000 A − Calculamos las siguientes probabilidades: a. Probabilidad de que un individuo sea alcohólico: P (A) = 100 = 0.10 1000 Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén. b. Probabilidad de que un individuo que sufra tales patologías sea realmente alcohólico: P (A/P T ) = 85 = 0.5743 148 Dado que las dos probabilidades calculadas no coinciden, podemos decir que la presencia de tales patologías y el alcoholismo no son sucesos independientes. c. Probabilidad de que un individuo con tales patologías no sea realmente alcohólico: − P (A/P T ) = 1 − 0.5743 = 0.4257 d. Probabilidad de que si un individuo es alcohólico presente tales patologías: P (P T /A) = 85 = 0.85 100 e. Probabilidad de que si un individuo es alcohólico no presente tales patologías: − P (P T /A) = 1 − 0.85 = 0.15 f. Probabilidad de que si un individuo no presenta tales patologías sea realmente alcohólico: − P (A/P T ) = 15 = 0.0176 852 g. Probabilidad de que no sea alcohólico un individuo que no presenta tales patologías: − − P (A/P T ) = 0.9824 h. Probabilidad de que un individuo de la población sea alcohólico y presente tales patologías: P (A ∩ P T ) = 85 = 0.085 1000 i. Probabilidad de que un individuo sea alcohólico o presente tales patologías: P (A ∪ P T ) = P (A) + P (P T ) − P (A ∩ P T ) = 0.10 + 0.148 − 0.085 = 0.1630 Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén. En base a las probabilidades calculadas podemos decir que tales patologías parecen estar ciertamente relacionadas con el alcoholismo: si un individuo es alcohólico, es bastante probable que presente tales patologías, y si un individuo no presenta tales patologías es prácticamente improbable que sea alcohólico. Ahora bien, entre los diagnosticados con tales patologías, un 57.43% son realmente alcohólicos frente a un 42.57% que no lo son, con lo cual, el diagnóstico de tales patologías no implicaría necesariamente alcoholismo. Ejemplo 3.5: Una urna contiene tres bolas negras y tres rojas. Si extraemos tres bolas con reemplazamiento (se devuelven a la urna), la probabilidad de que las tres sean rojas es igual a: P (R1 , R2 , R3 ) = P (R1 ∩ R2 ∩ R3 ) = P (R1 )P (R2 /R1 )P (R3 /R1 ∩ R2 ) = 333 = P (R1 )P (R2 )P (R3 ) = 666 3.6 Teorema de la probabilidad total. Teorema de Bayes. Sean B1 , B2 , ..., Bn sucesos tales que: (i) Bi ∩ Bj = ∅ ∀i 6= j (disjuntos dos a dos), (ii) Ω = n [ Bi , i=1 (iii) P (Bi ) 6= 0 ∀i, y sea A otro suceso de Ω para el que se conocen las probabilidades P (A/Bi ), i = 1, ..., n. Entonces, P (A) = n X P (A/Bi )P (Bi ), i=1 P (Bi /A) = P (A ∩ Bi ) P (A/Bi )P (Bi ) , i = 1, ..., n = Pn P (A) i=1 P (A/Bi )P (Bi ) La primera fórmula constituye el teorema de la probabilidad total y la segunda el de Bayes. Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén. Ejemplo 3.5: Se sabe que el 8% de las personas de cierta población padecen determinada enfermedad; para detectarla, se utiliza un test que da positivo el 95% de las veces que se aplica a alguien que la padece. Además, se sabe que el 1% de pacientes sanos dan también positivo en el test. Definimos los siguientes sucesos: E="Estar enfermo" − E ="Estar sano" T+ ="Test positivo" T− ="Test negativo" 1. (a) Obtener la probabilidad de que la prueba clasifique a una persona como enferma. − − P (T+ ) = P (T+ /E)P (E)+P (T+ /E)P (E) = 0.95∗0.08+0.01∗0.92 = 0.0852 (b) Obtener la probabilidad de que test de positivo sobre una persona que padece la enfermedad (Sensibilidad ) : P (T+ /E) = 0.95 (c) ¿Cuál es la probabilidad de que el test de negativo sobre una persona que no padece la enfermedad (Especifidad)? − P (E ∩ T− ) 0.92 ∗ 0.01 P (E/T− ) = = = 0.0101 P (T− ) 1 − 0.0852 − (d) ¿Cuál es la probabilidad de que una persona esté realmente enferma si la prueba la ha establecido como tal? P (E/T+ ) = P (E ∩ T+ ) P (T+ /E)P (E) = = 0.8920 P (T+ ) P (T+ ) Ejemplo 3.6: Una localidad consta de tres Zonas de Trabajo Social, A, B, y C. La ZTS A engloba el 30% de la población de la localidad, la ZTS B engloba otro 30%, y la C el 40% restante. Se sabe que el 2% de la población de A, el 3% de la de B y el 5% de la de C alguna vez ha sufrido algún tipo de maltrato. Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén. (a) ¿Cuál es la probabilidad de que un individuo de la localidad haya sufrido algún tipo de maltrato?. Si llamamos: A = pertenecer a la ZTS A, B = pertenecer a la ZTS B, C =pertenecer a la ZTS C, D =sufrir algún tipo de maltrato, P (D) = P (D/A)P (A) + P (D/B)P (B) + P (D/C)P (C) = 0.02 ∗ 0.3 + 0.03 ∗ 0.3 + 0.05 ∗ 0.4 = 0.035, es decir, un 3.5% de la población total ha sufrido algún tipo de maltrato. (b) Si sabemos que un individuo ha sufrido algún tipo de maltrato, ¿cuál es la probabilidad de que pertenezca a cada una de las zonas?. P (A/D) = = P (A ∩ D) P (D/A)P (A) = P (D) P (D/A)P (A) + P (D/B)P (B) + P (D/C)P (C) 0.02 ∗ 0.3 = 0.17 0.035 P (B/D) = P (B ∩ D) 0.03 ∗ 0.3 = = 0.26 P (D) 0.035 P (C/D) = 0.05 ∗ 0.4 P (C ∩ D) = = 0.57 P (D) 0.035 El 17% de los individuos que han sufrido algún tipo de maltrato pertenecen a la ZTS A, el 26% a la B, y el 57% a la C. Ejercicios 1. Una enfermedad puede estar producida por tres virus, A B, y C. En el laboratorio hay tres tubos de ensayo con el virus A, 2 tubos con el virus B, y 5 con el virus C. La probabilidad de que el virus A produzca la enfermedad es de 1/3, que la produzca B es de 2/3 y que la produzca C es Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén. de 1/7. Se inocula un virus a un animal y contrae la enfermedad. ¿Cuál es la probabilidad de que el virus que se inocule sea el C?. 2. Dos tratamientos A y B curan una determinada enfermedad en el 20% y 30% de los casos, respectivamente. Suponiendo que ambos actúan de modo independiente, ¿cuál de las dos estrategias siguientes utilizaría para curar a un individuo con tal enfermedad?. 1. Aplicar ambos tratamientos a la vez. 2. Aplicar primero el tratamiento B, y si no surte efecto, aplicar el A. 3. Con objeto de diagnosticar la colelitiasis se usan ultrasonidos. Tal técnica tiene una sensibilidad del 91% y una especificidad del 98%. En la población que nos ocupa la probabilidad de colelitiasis es del 20%. a. Si a un individuo de tal población se les aplican los ultrasonidos y dan positivos, ¿cuál es la probabilidad de que sufra colelitiasis? b. Si el resultado fuese negativo, ¿cuál es la probabilidad de que no tenga la enfermedad?. 4. La siguiente tabla recoge datos correspondientes a 20 individuos, clasificados según tienen o no pareja y el grado de felicidad (Bajo, Medio, Alto) que se asignan: PAREJA\GRADO FELICIDAD BAJO MEDIO ALTO SI 0 2 8 NO 3 5 2 Calcula las probabilidades necesarias en cada caso para contestar razonadamente las siguientes preguntas: a. Si encuestamos a un individuo y nos dice que tiene pareja, ¿qué grado de felicidad será más probable que se asigne?. b. Si encuestamos a un nuevo individuo y nos dice que no tiene pareja, ¿qué grado de felicidad será más probable que se asigne?. Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén. c. Si un individuo se ha asignado un grado de felicidad bajo, qué es más probable, que tenga pareja o que no tenga?. d. Si un individuo se ha asignado un grado de felicidad medio, qué es más probable, que tenga pareja o que no tenga?. e. Si un individuo se ha asignado un grado de felicidad alto, qué es más probable, que tenga pareja o que no tenga?. f. ¿Afecta entonces a la ”felicidad” de un joven el tener o no pareja?. Pon de manifiesto tus conclusiones en base a las probabilidades calculadas en los apartados anteriores. 5. En una determinada población se sabe que el 40% de las mujeres perciben rentas bajas, el 50% rentas medias y el resto rentas altas. Se está realizando un estudio sobre mujeres maltratadas y se sabe que entre las mujeres que reciben restas bajas el 27% han sido maltratadas en alguna ocasión, entre las de rentas medias el 19% y entre las de rentas bajas el 11%. a. Si seleccionamos al azar a una mujer del municipio, ¿cuál es la probabilidad de que haya sido maltratada en alguna ocasión?. b. Calcula la probabilidad de que una mujer haya sido alguna vez maltratada en cada uno de los estratos de renta (rentas bajas, medias, altas). c. ¿Existe alguna relación entre el nivel de renta que percibe una mujer y el hecho de haber sido o no en alguna ocasión matratada?. 6. La Dirección General de Tráfico investiga si a mayor dureza en sus campañas televisivas, se conduce con mayor precaución y se causan menos accidentes. Con este fin analiza el número de accidentes tras dos campañas, campaña 1 y campaña 2, de mayor dureza ésta última y aplicadas en años consecutivos en el mismo período vacacional. Los accidentes se Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén. clasifican según hayan sido o no causados por imprudencia del conductor. No accidentes por imprudencia No accidentes por otras causas Total Campaña 1 76 19 95 Campaña 2 78 24 102 Según esos datos, ¿causan efecto en el conductor las campañas de Tráfico?. Contesta en base al cálculo de probabilidades. Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.