Download Capítulo 3 Introducción a la Probabilidad

Document related concepts
no text concepts found
Transcript
Capítulo 3 Introducción a
la Probabilidad
Para extender los resultados del estudio descriptivo de las variables estadísticas
a poblaciones que no se observan completamente, es necesario utilizar la idea
de modelo probabilístico. En esta parte, se introduce, en primer lugar, la noción de probabilidad como idealización del concepto de frecuencia relativa. A
continuación se presenta la probabilidad condicionada y la definición de independencia. El concepto básico para la construcción de modelos probabilísticos
es el de variable aleatoria; el estudio que aquí se realiza es paralelo al que se ha
hecho en la primera parte con las variables estadísticas, considerándose su distribución de probabilidad, su media (o valor esperado), varianza, etc. Esta parte
finaliza con el estudio de algunas distribuciones de probabilidad bien conocidas.
3.1 Experimentos aleatorios. Sucesos.
Hay que distinguir entre dos tipos de experimentos o fenómenos: aleatorios
y determinísticos. Los fenómenos determinísticos son los que obedecen a una
relación causa-efecto y al variar poco las causas varía poco el efecto. Los fenómenos aleatorios se caracterizan porque al repetirse en condiciones análogas
presentan resultados impredecibles de antemano.
El objetivo del Cálculo de Probabilidades es el estudio de métodos de análisis
del comportamiento de fenómenos aleatorios.
1
El primer paso para estudiar un experimento aleatorio es registrar todos
sus posibles resultados. Al conjunto de todos los posibles resultados de un
experimento se le llama espacio muestral y lo denotamos por Ω. Puede estar
formado por un número finito o infinito de valores.
Ejemplo 3.1:
- Lanzamiento de un dado: Ω = {1, 2, ..., 6},
- Lanzamiento de dos monedas: Ω = {(c, c), (c, +), (+, c), (+, +)},
- Medición del tiempo entre dos ingresos consecutivos en un hospital: Ω =
R+
Un evento o suceso es un conjunto de resultados del espacio muestral. Si
está formado por un único elemento se dice elemental. Los denotaremos con
letras, A, B, C, etc.
Ejemplo 3.2:
- A=En el lanzamiento del dado se obtiene un número par ={2,4,6}
- B=En una muestra de 3 individuos con cáncer hay al menos uno que
fallece durante un determinado intervalo de tiempo.={(F,no F, no F), (no
F, F, no F), (no F, no F, F), (F, F, no F), (F, no F, F), (no F, F, F), (F,
F, F)}. La letra F denota fallecimiento.
Si el suceso contiene todos los resultados del espacio muestral se dice suceso
seguro, ya que ocurre siempre. Si no contiene ningún resultado del espacio
muestral se dice suceso imposible o nulo. Lo denotamos por ∅.
Dados dos sucesos A y B, podemos realizar las siguientes operaciones:
• Suceso A ∪ B : está formado por la unión de resultados de A y B. Ocurre
si ocurre A o B (o ambos).
• Suceso A ∩ B : está formado por los resultados comunes de A y B. Ocurre
siempre que ocurran A y B simultáneamente.
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
• A y B son incompatibles, mutuamente excluyentes o disjuntos si no pueden
ocurrir simultáneamente, A ∩ B = ∅.
• Si cualquier resultado de A es también resultado de B, entonces A está
contenido en B, A ⊂ B.
−
• A es el suceso complementario de A si ocurre siempre que no ocurre A,
−
−
A = Ω − A, A ∩ A = ∅.
−
−
−
−
−
−
• Leyes de Morgan: A ∪ B = A ∩ B, A ∩ B = A ∪ B.
Ejemplo 3.3: Sobre el ejemplo anterior, referente a individuos con cáncer,
consideremos ahora los siguientes sucesos:
-A: el primer individuo fallece
-B : el segundo individuo fallece
-C: el tercer individuo fallece
A partir ellos obtenemos la expresión de los siguientes:
-Los tres individuos fallecen: A ∩ B ∩ C
−
-Sólo los dos primeros fallecen: A ∩ B ∩ C
-Alguno de los individuos fallece: A ∪ B ∪ C
−
−
−
-Ninguno de los individuos fallece: A ∩ B ∩ C, contrario del anterior.
3.2 Interpretaciones de la probabilidad
3.2.1 Definición clásica
Sea Ω un espacio muestral finito con n elementos. La probabilidad de cada
1
elemento es la misma, igual a (espacio equiprobable). Se define la probabilidad
n
de un suceso A como:
P (A) =
Número de casos favorables a A (en Ω)
Número de casos posibles
Por ejemplo, la probabilidad de que al lanzar un dado se obtenga un no par
3
1
es = , ya que la probabilidad de obtener cada uno de los resultados es la
6
2
misma e igual a 1/6.
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
En general, la probabilidad de un suceso es la suma de las probabilidades de
sus elementos. Si el espacio muestral es equiprobable, la expresión es la dada
anteriormente.
3.2.2 Definición frecuentista
Si un experimento se repite n veces y nA resultados son favorables a un suceso
A, el límite cuando n es suficientemente grande (n− > ∞) se toma como probabilidad de A. Esta definición relaciona probabilidad con frecuencia relativa.
P (A) = lim
n−>∞
nA
n
Por ejemplo, si lanzamos una moneda 5 veces y en esas 5 veces se obtienen
4 caras, no podemos decir que la probabilidad de obtener una cara en un lanzamiento es 4/5. Sin embargo, si lanzamos la moneda un número de veces
suficientemente grande los resultados se van estabilizando,
28
50
60 , ..., 100 −
> 12 .
3.2.3 Definición axiomática (Kolmogorov)
Se llama función de probabilidad a una aplicación
P :
Ω
−→
R
A
−→
P (A)
tal que:
(i) P (A) ≥ 0, ∀A ⊂ Ω
(ii) P (Ω) = 1
(iii) Para toda sucesión de sucesos disjuntos dos a dos, {A1 , A2, ...} tales que
Ai ∩ Aj = ∅ ∀i 6= j, entonces
̰ !
∞
[
X
Ai =
P (Ai )
P
i=1
i=1
En consecuencia se obtienen las propiedades de la probabilidad:
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
(i) P (∅) = 0
−
(ii) P (A) = 1 − P (A)
(iii) 0 ≤ P (A) ≤ 1
(iv) Si A ⊂ B, P (A) ≤ P (B)
(v) P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
3.4 Probabilidad condicionada
Hasta ahora hemos visto el concepto de probabilidad partiendo de que la única
información que tenemos sobre el experimento es el espacio muestral. Sin embargo, en ocasiones se conoce que un determinado suceso ha ocurrido. ¿Modificará esta información adicional la probabilidad de que ocurra otro suceso?.
Veremos que generalmente sí.
Definimos a continuación formalmente la probabilidad condicionada.
- Probabilidad de A condicionada a B, P (A/B): probabilidad de que ocurra
A si ha ocurrido B
P (A/B) =
P (A ∩ B)
, P (B) 6= 0
P (B)
- Probabilidad de B condicionada a A, P (B/A) : probabilidad de que ocurra
B si ha ocurrido A
P (B/A) =
P (A ∩ B)
, P (A) 6= 0
P (A)
Si despejamos en ambas se obtiene que:
P (A ∩ B) = P (A)P (B/A) = P (B)P (A/B)
A esta expresión se le conoce como regla de la multiplicación, que en general
para un número k de sucesos viene dada por:
P (A1 ∩ A2 ∩ ... ∩ Ak ) = P (A1 )P (A2 /A1 )....P (Ak /A1 ∩ A2 ∩ ... ∩ Ak−1 )
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
3.5 Independencia de sucesos
Sean A y B dos sucesos del espacio muestral. El suceso A se dice independiente
del suceso B si el conocimiento de la ocurrencia de B no modifica la probabilidad
de aparición de A, es decir, si
P (A/B) = P (A)
En consecuencia,
P (A ∩ B) = P (B)P (A/B) = P (B)P (A)
y
P (B/A) =
P (B)P (A)
= P (B),
P (A)
por lo que también B es independiente de A. Diremos entonces que A y B son
sucesos independientes.
Ejemplo 3.4: La proporción de alcohólicos en una determinada población
es aproximadamente de un 10%; no obstante, en las bajas que dan los médicos
de la Seguridad Social difícilmente se encuentra el diagnóstico de alcoholismo.
Aparecen sin embargo diagnosticados de hepatopatías, lumbalgias, etc., que
pueden hacer sospechar de alcoholismo subyacente. Se realizó un estudio sobre
1000 individuos, clasificados en la siguiente tabla según presenten o no realmente alcoholismo y según les hayan sido diagnosticadas o no tales patologías.
Denotamos por A al suceso "ser alcohólico", y por P T al suceso "presentar tales
patologías".
−
PT
PT
Total
85
15
100
A
63
837
900
Total
148
852
1000
A
−
Calculamos las siguientes probabilidades:
a. Probabilidad de que un individuo sea alcohólico:
P (A) =
100
= 0.10
1000
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
b. Probabilidad de que un individuo que sufra tales patologías sea realmente
alcohólico:
P (A/P T ) =
85
= 0.5743
148
Dado que las dos probabilidades calculadas no coinciden, podemos decir que la presencia de tales patologías y el alcoholismo no son sucesos
independientes.
c. Probabilidad de que un individuo con tales patologías no sea realmente
alcohólico:
−
P (A/P T ) = 1 − 0.5743 = 0.4257
d. Probabilidad de que si un individuo es alcohólico presente tales patologías:
P (P T /A) =
85
= 0.85
100
e. Probabilidad de que si un individuo es alcohólico no presente tales patologías:
−
P (P T /A) = 1 − 0.85 = 0.15
f. Probabilidad de que si un individuo no presenta tales patologías sea realmente alcohólico:
−
P (A/P T ) =
15
= 0.0176
852
g. Probabilidad de que no sea alcohólico un individuo que no presenta tales
patologías:
−
−
P (A/P T ) = 0.9824
h. Probabilidad de que un individuo de la población sea alcohólico y presente
tales patologías:
P (A ∩ P T ) =
85
= 0.085
1000
i. Probabilidad de que un individuo sea alcohólico o presente tales patologías:
P (A ∪ P T ) = P (A) + P (P T ) − P (A ∩ P T ) = 0.10 + 0.148 − 0.085 = 0.1630
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
En base a las probabilidades calculadas podemos decir que tales patologías
parecen estar ciertamente relacionadas con el alcoholismo: si un individuo es
alcohólico, es bastante probable que presente tales patologías, y si un individuo
no presenta tales patologías es prácticamente improbable que sea alcohólico.
Ahora bien, entre los diagnosticados con tales patologías, un 57.43% son realmente alcohólicos frente a un 42.57% que no lo son, con lo cual, el diagnóstico
de tales patologías no implicaría necesariamente alcoholismo.
Ejemplo 3.5: Una urna contiene tres bolas negras y tres rojas. Si extraemos
tres bolas con reemplazamiento (se devuelven a la urna), la probabilidad de que
las tres sean rojas es igual a:
P (R1 , R2 , R3 ) = P (R1 ∩ R2 ∩ R3 ) = P (R1 )P (R2 /R1 )P (R3 /R1 ∩ R2 ) =
333
= P (R1 )P (R2 )P (R3 ) =
666
3.6 Teorema de la probabilidad total. Teorema
de Bayes.
Sean B1 , B2 , ..., Bn sucesos tales que:
(i) Bi ∩ Bj = ∅ ∀i 6= j (disjuntos dos a dos),
(ii) Ω =
n
[
Bi ,
i=1
(iii) P (Bi ) 6= 0 ∀i,
y sea A otro suceso de Ω para el que se conocen las probabilidades P (A/Bi ),
i = 1, ..., n. Entonces,
P (A) =
n
X
P (A/Bi )P (Bi ),
i=1
P (Bi /A) =
P (A ∩ Bi )
P (A/Bi )P (Bi )
, i = 1, ..., n
= Pn
P (A)
i=1 P (A/Bi )P (Bi )
La primera fórmula constituye el teorema de la probabilidad total y la segunda el de Bayes.
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
Ejemplo 3.5: Se sabe que el 8% de las personas de cierta población padecen
determinada enfermedad; para detectarla, se utiliza un test que da positivo el
95% de las veces que se aplica a alguien que la padece. Además, se sabe que el
1% de pacientes sanos dan también positivo en el test.
Definimos los siguientes sucesos:
E="Estar enfermo"
−
E ="Estar sano"
T+ ="Test positivo"
T− ="Test negativo"
1. (a) Obtener la probabilidad de que la prueba clasifique a una persona
como enferma.
−
−
P (T+ ) = P (T+ /E)P (E)+P (T+ /E)P (E) = 0.95∗0.08+0.01∗0.92 = 0.0852
(b) Obtener la probabilidad de que test de positivo sobre una persona
que padece la enfermedad (Sensibilidad ) :
P (T+ /E) = 0.95
(c) ¿Cuál es la probabilidad de que el test de negativo sobre una persona
que no padece la enfermedad (Especifidad)?
−
P (E ∩ T− )
0.92 ∗ 0.01
P (E/T− ) =
=
= 0.0101
P (T− )
1 − 0.0852
−
(d) ¿Cuál es la probabilidad de que una persona esté realmente enferma
si la prueba la ha establecido como tal?
P (E/T+ ) =
P (E ∩ T+ )
P (T+ /E)P (E)
=
= 0.8920
P (T+ )
P (T+ )
Ejemplo 3.6: Una localidad consta de tres Zonas de Trabajo Social, A,
B, y C. La ZTS A engloba el 30% de la población de la localidad, la ZTS B
engloba otro 30%, y la C el 40% restante. Se sabe que el 2% de la población
de A, el 3% de la de B y el 5% de la de C alguna vez ha sufrido algún tipo de
maltrato.
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
(a) ¿Cuál es la probabilidad de que un individuo de la localidad haya sufrido
algún tipo de maltrato?.
Si llamamos:
A = pertenecer a la ZTS A,
B = pertenecer a la ZTS B,
C =pertenecer a la ZTS C,
D =sufrir algún tipo de maltrato,
P (D) = P (D/A)P (A) + P (D/B)P (B) + P (D/C)P (C)
= 0.02 ∗ 0.3 + 0.03 ∗ 0.3 + 0.05 ∗ 0.4 = 0.035,
es decir, un 3.5% de la población total ha sufrido algún tipo de maltrato.
(b) Si sabemos que un individuo ha sufrido algún tipo de maltrato, ¿cuál es
la probabilidad de que pertenezca a cada una de las zonas?.
P (A/D) =
=
P (A ∩ D)
P (D/A)P (A)
=
P (D)
P (D/A)P (A) + P (D/B)P (B) + P (D/C)P (C)
0.02 ∗ 0.3
= 0.17
0.035
P (B/D) =
P (B ∩ D)
0.03 ∗ 0.3
=
= 0.26
P (D)
0.035
P (C/D) =
0.05 ∗ 0.4
P (C ∩ D)
=
= 0.57
P (D)
0.035
El 17% de los individuos que han sufrido algún tipo de maltrato pertenecen
a la ZTS A, el 26% a la B, y el 57% a la C.
Ejercicios
1. Una enfermedad puede estar producida por tres virus, A B, y C. En el
laboratorio hay tres tubos de ensayo con el virus A, 2 tubos con el virus
B, y 5 con el virus C. La probabilidad de que el virus A produzca la
enfermedad es de 1/3, que la produzca B es de 2/3 y que la produzca C es
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
de 1/7. Se inocula un virus a un animal y contrae la enfermedad. ¿Cuál
es la probabilidad de que el virus que se inocule sea el C?.
2. Dos tratamientos A y B curan una determinada enfermedad en el 20%
y 30% de los casos, respectivamente. Suponiendo que ambos actúan de
modo independiente, ¿cuál de las dos estrategias siguientes utilizaría para
curar a un individuo con tal enfermedad?.
1. Aplicar ambos tratamientos a la vez.
2. Aplicar primero el tratamiento B, y si no surte efecto, aplicar el A.
3. Con objeto de diagnosticar la colelitiasis se usan ultrasonidos. Tal técnica
tiene una sensibilidad del 91% y una especificidad del 98%. En la población
que nos ocupa la probabilidad de colelitiasis es del 20%.
a. Si a un individuo de tal población se les aplican los ultrasonidos y
dan positivos, ¿cuál es la probabilidad de que sufra colelitiasis?
b. Si el resultado fuese negativo, ¿cuál es la probabilidad de que no
tenga la enfermedad?.
4. La siguiente tabla recoge datos correspondientes a 20 individuos, clasificados según tienen o no pareja y el grado de felicidad (Bajo, Medio, Alto)
que se asignan:
PAREJA\GRADO FELICIDAD
BAJO
MEDIO
ALTO
SI
0
2
8
NO
3
5
2
Calcula las probabilidades necesarias en cada caso para contestar razonadamente las siguientes preguntas:
a. Si encuestamos a un individuo y nos dice que tiene pareja, ¿qué grado
de felicidad será más probable que se asigne?.
b. Si encuestamos a un nuevo individuo y nos dice que no tiene pareja,
¿qué grado de felicidad será más probable que se asigne?.
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
c. Si un individuo se ha asignado un grado de felicidad bajo, qué es más
probable, que tenga pareja o que no tenga?.
d. Si un individuo se ha asignado un grado de felicidad medio, qué es
más probable, que tenga pareja o que no tenga?.
e. Si un individuo se ha asignado un grado de felicidad alto, qué es más
probable, que tenga pareja o que no tenga?.
f. ¿Afecta entonces a la ”felicidad” de un joven el tener o no pareja?.
Pon de manifiesto tus conclusiones en base a las probabilidades calculadas en los apartados anteriores.
5. En una determinada población se sabe que el 40% de las mujeres perciben
rentas bajas, el 50% rentas medias y el resto rentas altas. Se está realizando un estudio sobre mujeres maltratadas y se sabe que entre las
mujeres que reciben restas bajas el 27% han sido maltratadas en alguna
ocasión, entre las de rentas medias el 19% y entre las de rentas bajas el
11%.
a. Si seleccionamos al azar a una mujer del municipio, ¿cuál es la probabilidad de que haya sido maltratada en alguna ocasión?.
b. Calcula la probabilidad de que una mujer haya sido alguna vez maltratada en cada uno de los estratos de renta (rentas bajas, medias,
altas).
c. ¿Existe alguna relación entre el nivel de renta que percibe una mujer
y el hecho de haber sido o no en alguna ocasión matratada?.
6. La Dirección General de Tráfico investiga si a mayor dureza en sus campañas televisivas, se conduce con mayor precaución y se causan menos
accidentes. Con este fin analiza el número de accidentes tras dos campañas, campaña 1 y campaña 2, de mayor dureza ésta última y aplicadas
en años consecutivos en el mismo período vacacional. Los accidentes se
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
clasifican según hayan sido o no causados por imprudencia del conductor.
No accidentes por imprudencia
No accidentes por otras causas
Total
Campaña 1
76
19
95
Campaña 2
78
24
102
Según esos datos, ¿causan efecto en el conductor las campañas de Tráfico?.
Contesta en base al cálculo de probabilidades.
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.