Download 02 - Introducción a la teoría de probabilidad Contenido Repaso de

Document related concepts
no text concepts found
Transcript
Contenido
02 - Introducción a la teoría de
probabilidad
Diego Andrés Alvarez Marín
Profesor Asistente
Universidad Nacional de Colombia
Sede Manizales
●
Repaso de teoría de conjuntos
●
Fenómenos determinísticos vs. fenómenos aleatorios
●
Definición de probabilidad
●
Interpretación frecuentista y Bayesiana de la probabilidad
●
Espacio muestral, eventos
●
Sigma-álgebra
●
Medida de probabilidad, definición, propiedades
●
Axiomas de Kolmogorov
●
Probabilidad conjunta, marginal, condicional
●
Eventos independientes
●
Teorema de las probabilidades totales, teorema de Bayes
●
Técnicas de conteo: factorial, permutación, combinatoria
1
2
Operaciones con conjuntos
Repaso de la teoría de conjuntos
3
4
Diagramas de Venn
Propiedades
5
6
7
8
Conjunto potencia (power set)
Ejemplos de teoría de conjuntos
9
Teoría de la probabilidad
Probabilidad
La teoría de la probabilidad es la teoría matemática que
modela los fenómenos aleatorios.
Un fenómeno (o experimento) aleatorio es aquel que,
a pesar de realizarse el experimento bajo las mismas
condiciones determinadas, tiene como resultados
posibles un conjunto de alternativas (el llamado espacio
muestral), como el lanzamiento de un dado o de una
moneda.
Estos deben contraponerse a los fenómenos
determinísticos, en los cuales el resultado de un
experimento, realizado bajo condiciones determinadas,
produce un resultado único o previsible: por ejemplo, el
agua calentada a 100 grados Celsius, a nivel del mar, se
transforma en vapor.
10
La probabilidad es una forma de expresar el
conocimiento o la creencia que un evento ha
ocurrido o va a ocurrir.
Existen dos formas de interpretar la probabilidad:
●Interpretación frecuentista
●Interpretación Bayesiana
La comunidad científica está dividida entre
personas que apoyan una interpretación o la otra.
11
12
Interpretación frecuentista de
probabilidad
Los frecuentistas hablan sobre probabilidades
solo cuando se trata de experimentos que son
aleatorios y están bien definidos.
La probabilidad de un evento se refiere a la
frecuencia relativa de ocurrencia del resultado de
un experimento aleatorio.
Interpretación Bayesiana de
probabilidad
Los Bayesianos utilizan la probabilidad como un medio
subjetivo para representar el grado de creencia en una
afirmación, dada la evidencia. Ellos asignan
probabilidades a cualquier afirmación, incluso cuando
no hay un experimento aleatorio involucrado.
Ejemplo: la probabilidad que el Once Caldas gane el
próximo partido es del 80% (o la probabilidad que
pierda o empate es del 20%). Esto quiere decir que
una apuesta justa sería 8 a 2 a que el Once ganaría.
Ganancia = -8 x 0.2 + 2 x 0.8 = 0
Interpretación frecuentista de probabilidad
De este modo para un frecuentista, la definición
de probabilidad sería:
Definición: si un experimento que está sujeto al
azar resulta de n formas igualmente probables y
mutuamente excluyentes (es decir que ocurren
bajo las mismas condiciones), y su nA de estos
resultados tienen un atributo A, la probabilidad del
atributo A es:
Nota 1: A veces el futuro no se puede predecir y
solo se puede calcular la probabilidad de que algo
suceda.
Nota 2: En el lanzamiento de un dado los
resultados son mutuamente excluyentes y
mutuamente probables. La probabilidad de
obtener un 4 es 1/6. Esto no significa que en 6
tiradas tengamos necesariamente que obtener un
4.
Nota 3: El desarrollo inicial de la teoría de
probabilidades se asocia al estudio de los juegos
de azar.
Espacio muestral Ω
●
●
●
●
Es el conjunto de todos los posibles resultados
de un experimento aleatorio.
Los elementos ω del conjunto Ω se denominan
puntos muestrales.
El espacio muestral Ω puede ser
–
Discreto (cardinalidad finita o infinita contable: los
resultados pueden ponerse uno a uno con los
números naturales)
–
Continuo (cardinalidad infinita no contable: los
resultados consisten de intervalos de los números
reales)
Un evento (o suceso) del espacio muestral es
un subconjunto de Ω cuyos miembros tienen
una característica común.
17
Espacio muestral discreto
●
18
●
Las caras de un dado forman el espacio
muestral
Las especificaciones de un computador pueden
especificarse en 1, 2 o 4 Gb de memoria y en
200, 300 o 400 Gb de disco duro, tienen el
espacio muestral:
Ω = {(1,200); (2,200); (4,200); (1,300);
(2,300); (4,300); (1,400); (2,400); (4,400)}
●
Cada uno de los cuatro bits transmitidos se
clasifica como con error o sin error.
●
s = sin error, c = con error
El número de lanzamientos de una moneda
hasta obtener caras tiene el espacio muestral
Ω = {1, 2, 3, 4, ..., ∞}
19
20
Espacio muestral continuo
●
●
El espacio muestral que representa la altura de
una persona se puede especificar por el
espacio muestral Ω = [0, 3] metros.
El espacio muestral que representa el tiempo
que se debe esperar la buseta se puede
especificar por el espacio muestral Ω = [0, ∞)
minutos.
21
Espacio muestral en experimentos
con reemplazo y sin reemplazo
Eventos
●
●
●
●
22
El espacio muestral Ω es un evento que se le
llama el evento seguro
El conjunto vacío Ø es un evento llamado el
evento imposible
Sean dos eventos A y B, si ambos son
conjuntos disjuntos, entonces ellos son
eventos mutuamente excluyentes.
A una colección de eventos A1, A2, A3... (sea
finita o infinita contable) se le conoce como
eventos exhaustivos si su unión es el espacio
muestral Ω.
23
24
Diagrama del árbol
Sigma-algebra: motivación
Cuando
analizamos
eventos
aleatorios,
generalmente no estamos interesados en Ω sino
en un subconjunto E ∈ Ω.
Cuando analizamos las probabilidades de
ocurrencia del evento E, tambien nos interesan
las probabilidades de la no ocurrencia del evento
E.
Además si nos interesa la probabilidad de
ocurrencia de los eventos A1 y A2 también nos
interesaría la probabilidad de su unión.
25
Sigma-álgebra
26
Ejemplos
27
28
Algunas definiciones
Andrey Nikolaevich Kolmogorov
Un par ordenado (X, σX), donde X es un conjunto y
σX una σ-álgebra sobre éste, se denomina espacio
medible.
(Abril 25, 1903 – Octubre 20, 1987)
Una función entre dos espacios medibles se
denomina función medible si la preimagen de todo
conjunto medible es también medible; esto es, si (X,
σX) y (Y, σY) son dos espacios medibles, una función
f:X→Y es medible si para todo E ∈ σY, f−1(E) ∈ σX.
Una medida es una cierta clase de función que
mapea puntos de una σ-álgebra al intervalo [0,∞).
29
Axiomas de probabilidad de Kolmogorov
30
Axiomas de probabilidad de Kolmogorov
31
32
Consecuencias de los tres axiomas
de probabilidad
Consecuencias de los tres axiomas
de probabilidad
33
Consecuencias de los tres axiomas
de probabilidad
34
Consecuencias de los tres axiomas
de probabilidad
35
36
Ejemplos
37
38
Probabilidad conjunta
●
Probabilidad marginal
Cual es la probabilidad de ser mujer fumadora?
●
B1 (hombre) B2 (mujer)
B1 (hombre) B2 (mujer)
A1 (fumador)
A2 (no fumador)
14
40
Cual es la probabilidad de ser fumador?
A1 (fumador)
A2 (no fumador)
17
29
Suma sobre todos los j
39
14
40
17
29
Suma sobre todos los i
40
Probabilidad condicional
●
Probabilidad condicional
Cual es la probabilidad de ser fumador dado
que se es mujer?
●
B1 (hombre) B2 (mujer)
A1 (fumador)
A2 (no fumador)
14
40
Cual es la probabilidad de ser mujer dado que
se es fumador?
B1 (hombre) B2 (mujer)
A1 (fumador)
A2 (no fumador)
17
29
Probabilidad condicional de Ai dada la ocurrencia de Bj
14
40
17
29
Probabilidad condicional de Bj dada la ocurrencia de Ai
41
42
●
Diagrama del árbol
En general, tenemos la
regla de la multiplicación:
●
43
Para definir las probabilidades conjuntas,
marginales y condicionales se ha empleado un
ejemplo específico en el que el espacio
muestral contiene un número finito de
resultados. Sin embargo, las definiciones
dadas aquí son completamente generales y
pueden extenderse para cualquier espacio
muestral, ya sea discreto o continuo.
44
Ejemplo
La paradoja del falso positivo
En una encuesta de televisión se determina que al 20%
de las personas les gusta el programa A, al 16% de las
personas les gusta el programa B y al 1% de les gusta
ambos programas. Si se selecciona al azar un
televidente de B(A), cual es la probabilidad que también
le guste A(B)?
45
46
47
48
49
Propiedades de la probabilidad
condicional
50
Ejemplos
51
52
Probabilidad condicional con varias
variables aleatorias
Ejemplo
Una bolsa tiene 10 bolas blancas y 30 rojas.
¿Cuál es la probabilidad de muestrear BBRB?
Muestreo sin reemplazo
Muestreo con reemplazo
53
Ejemplo
54
Arboles de decisión
55
56
Ejemplo
57
58
Eventos independientes
Ejemplo
Una pareja planifica utilizando DemoProvera
(confiabilidad = 99.7%/año) y condón de latex
masculino (confiabilidad = 98%/año)
simultáneamente. Si la probabilidad de quedar en
embarazo al tener relaciones sin protección es
del 85%/año, ¿cuál es la probabilidad de un
embarazo no deseado?
Porcentajes sacados de: http://en.wikipedia.org/wiki/Comparison_of_birth_control_methods
59
60
Eventos independientes
Ejemplo
Esto quiere decir que si la ocurrencia de B no tiene
ningún efecto sobre la probabilidad de A, entonces se
tiene que P(A|B)=P(A), a pesar que ha ocurrido el evento
B.
Dentro de la teoría matemática, sólo podemos probar la
independencia de eventos obteniendo P(A), P(B) y
P(A∩B) y demostrando que se verifica una de las
ecuaciones anteriores marcadas en el recuadro. En la
práctica de ingeniería, normalmente se confía en el
conocimiento de la situación física para afirmar que en
el modelo dos eventos particulares se supondrán (o no)
independientes.
61
62
Ejemplo
Nivel total
de demanda
Suponga que se quiere diseñar el acueducto de un
parque industrial que tendrá dos fábricas.
Supongamos que existen dos niveles de demanda de
agua: W1 = 1 m3/min y W2 = 2 m3/min. La probabilidad
que cualquier fábrica requiera dichos niveles de
demanda son 0.3 y 0.7 respectivamente (P(W1)=0.3,
P(W2)=0.7). Dichos niveles de demanda de ambas
fábricas son estádísticamente independientes.
P(W1W1) = P(W1)P(W1)=0.3 x 0.3 = 0.09
P(W1W2) = P(W1)P(W1)=0.3 x 0.7 = 0.21
0.42
P(W2W1) = P(W2)P(W1)=0.7 x 0.3 = 0.21
P(W2W2) = P(W2)P(W2)=0.7 x 0.7 = 0.49
1.00
2 = W 1W 1 3 = W 2W 1
3 = W 1W 2 4 = W 2W 2
¿Cuál es la combinación de niveles de demanda
menos probable? más probable?
Fabrica 1
2
3
3
4
Fabrica 2
63
64
Si los costos de instalación inicial y de ensanche
son los siguientes:
Costos de instalación inicial:
Dos unidades
= $2500
Tres unidades
= $3000
Cuatro unidades = $4000
Costo de ensanche:
Dos a tres unidades
= $1200
Tres a cuatro unidades = $1500
Dos a cuatro unidades = $2000
Que capacidad inicial instalaría usted de modo
que el costo total esperado del proyecto sea el
mínimo?
Capacidad
inicial
Costo
inicial
2 unidades
2500
3 unidades
3000
4 unidades
4000
Pérdida
Pérdida
esperada si esperada si
se necesitan se necesitan Costo total
3 unidades 4 unidades esperado
(0,21 + 0,21) 0.49 x 2000 =
x 1200 = 504
980
3984
0
0.49 x 1500 =
735
3750
0
0
4000
Lo mejor será instalar 3 unidades = 3 m3/min
65
Regla de la multiplicación para
eventos independientes
66
Ejemplo
67
68
Condere una red de acueducto. En el gráfico se
muestra la configuración de la misma junto con la
posición de las bombas A, B, C y D. Dado que la
probabilidad de falla de dichas bombas es 0.2, 0.3,
0.1 y 0.05 respectivamente, calcule la probabilidad
con la que el agua puede efectivamente
transportarse desde el punto 1 hasta el punto 2.
Tenga en cuenta que:
69
70
71
72
serie
paralelo
73
Relación entre eventos independientes
y eventos mutuamente excluyentes
Propiedad de Markov
●
●
74
P(A|B,C) = P(A|B) independientemente de la
ocurrencia de C
Ver
–
http://en.wikipedia.org/wiki/Markov_chain
–
http://en.wikipedia.org/wiki/Examples_of_Markov_chains
–
http://en.wikipedia.org/wiki/Markov_property
75
76
Teorema de las probabilidades totales
Para un chip se sabe que:
77
78
Teorema de Bayes
Thomas Bayes
(aprox. 1702 – Abril 7, 1761)
Essay Towards
Solving a
Problem in the
Doctrine of
Chances (1764)
79
80
Ejercicio
Suponga que tenemos dos urnas: A y B. Las cuales se
muestran en la figura. En A hay siete bolas rojas (red - R)
y tres bolas blancas (white - W). En B hay una bola roja y
nueve blancas. Se lanza una moneda. Si caen caras se
saca una bola de la urna A y si cae en sellos se saca una
bola de la urna B. Si se lanzó la moneda y se sacó una
bola roja, cual es la probabilidad que esta bola provenga
de la urna A?
81
82
Problema de Monty Hall
http://en.wikipedia.org/wiki/Monty_Hall_problem
Supón que estás en el concurso de televisión
Let's make a deal, y se te ofrece escoger entre
tres puertas: detrás de una de ellas hay un coche,
y detrás de las otras, cabras. Escoges una
puerta, digamos la nº1, y el presentador, llamado
Monty Hall, que sabe lo que hay detrás de las
puertas, abre otra, digamos la nº3, que contiene
una cabra. Entonces te pregunta: "¿No prefieres
escoger la nº2?". ¿Es mejor para ti cambiar tu
elección?
83
84
Problema de Monty Hall
Problema de Monty Hall
El jugador tiene
inicialmente la
probabilidad 1/3
de seleccionar
inicialmente un
carro, la cabra
A o la cabra B.
Cambiar
incrementa la
posibilidad de
ganar a 2/3.
85
Problema de Monty Hall
86
Redes bayesianas
87
88
Conteo de datos con la ayuda del
factorial
Ejercicios
Para calcular las probabilidades de varios
eventos es necesario contar el número de
resultados posibles de un experimento o contar el
número de resultados que son favorables a un
evento dado. El proceso de conteo puede
simplificarse mediante el empleo de dos técnicas
de conteo denominadas permutaciones y
combinaciones.
89
Factorial
90
Factorial
91
92
Factorial en MATLAB
Factorial en MS EXCEL
Se calcula utilizando la función FACT
FACTORIAL(N):
como los números
de doble precision
solo almacenan
15 dígitos, la
respuesta es
exacta para N≤21.
Si N>21, la
respuesta solo
será aproximada.
93
94
Permutación P(n,r)
La función gamma
Es el número de arreglos en un orden en
particular de los elementos que forman un
conjunto.
De cuantas formas diferentes se pueden ubicar a,
b y c?
a b c Para la primera posición se escoje cualquiera de las
a c b letras
b a c Para la segunda posición se puede escoger dos
b c a letras para la primera posición
c a b Para la última posición se escoje la letra restante
cba
La función gamma en MS EXCEL y en MATLAB
En este caso tenemos 3x2x1 = 6 posibilidades
95
96
Permutación P(n,r)
Combinatoria C(n,r)
De los objetos de un conjunto, es una selección
de estos sin importar el orden.
Se divide por r! ya que en cada combinación
existen r! permutaciones
97
98
Ejemplo
Combinatoria vs Permutación
Supongamos que el grupo de probabilidad y
estadística está formado por 35 estudiantes.
Cuantos grupos de tres estudiantes podrían
formarse para hacer un trabajo?
La diferencia entre una permutación y una
combinatoria es que en la primera el interés se
centra en contar todas las posibles selecciones y
todos los arreglos de estas, mientras que en la
segunda el interés sólo recae en contar el número
de selecciones diferentes.
La solución es
Ejemplo: abc y acb son diferentes permutaciones
pero son iguales combinación de las letras
99
100
Ejemplo
Permutación y combinación en
MS EXCEL y MATLAB
101
102
Ejemplo
Ejemplo
103
104
Ejemplo
Problema del cumpleaños
http://en.wikipedia.org/wiki/Birthday_problem
Un grupo de n personas está reunido en una
habitación, ¿qué tan probable es que dos o más
de ellas cumplan años el mismo día?
Supongamos que:
●
●
no existen años de 366 días (bisiestos)
los cumpleaños se distribuyen uniformemente a
lo largo del año
105
Problema del cumpleaños
106
Problema del cumpleaños
De acuerdo con este gráfico y para
las hipótesis dadas, en un grupo de
al menos 23 personas es probable
encontrar con una probabilidad
mayor del 50% dos personas que
cumplan años el mismo día
107
108