Download 02 - Introducción a la teoría de probabilidad Contenido Repaso de
Document related concepts
no text concepts found
Transcript
Contenido 02 - Introducción a la teoría de probabilidad Diego Andrés Alvarez Marín Profesor Asistente Universidad Nacional de Colombia Sede Manizales ● Repaso de teoría de conjuntos ● Fenómenos determinísticos vs. fenómenos aleatorios ● Definición de probabilidad ● Interpretación frecuentista y Bayesiana de la probabilidad ● Espacio muestral, eventos ● Sigma-álgebra ● Medida de probabilidad, definición, propiedades ● Axiomas de Kolmogorov ● Probabilidad conjunta, marginal, condicional ● Eventos independientes ● Teorema de las probabilidades totales, teorema de Bayes ● Técnicas de conteo: factorial, permutación, combinatoria 1 2 Operaciones con conjuntos Repaso de la teoría de conjuntos 3 4 Diagramas de Venn Propiedades 5 6 7 8 Conjunto potencia (power set) Ejemplos de teoría de conjuntos 9 Teoría de la probabilidad Probabilidad La teoría de la probabilidad es la teoría matemática que modela los fenómenos aleatorios. Un fenómeno (o experimento) aleatorio es aquel que, a pesar de realizarse el experimento bajo las mismas condiciones determinadas, tiene como resultados posibles un conjunto de alternativas (el llamado espacio muestral), como el lanzamiento de un dado o de una moneda. Estos deben contraponerse a los fenómenos determinísticos, en los cuales el resultado de un experimento, realizado bajo condiciones determinadas, produce un resultado único o previsible: por ejemplo, el agua calentada a 100 grados Celsius, a nivel del mar, se transforma en vapor. 10 La probabilidad es una forma de expresar el conocimiento o la creencia que un evento ha ocurrido o va a ocurrir. Existen dos formas de interpretar la probabilidad: ●Interpretación frecuentista ●Interpretación Bayesiana La comunidad científica está dividida entre personas que apoyan una interpretación o la otra. 11 12 Interpretación frecuentista de probabilidad Los frecuentistas hablan sobre probabilidades solo cuando se trata de experimentos que son aleatorios y están bien definidos. La probabilidad de un evento se refiere a la frecuencia relativa de ocurrencia del resultado de un experimento aleatorio. Interpretación Bayesiana de probabilidad Los Bayesianos utilizan la probabilidad como un medio subjetivo para representar el grado de creencia en una afirmación, dada la evidencia. Ellos asignan probabilidades a cualquier afirmación, incluso cuando no hay un experimento aleatorio involucrado. Ejemplo: la probabilidad que el Once Caldas gane el próximo partido es del 80% (o la probabilidad que pierda o empate es del 20%). Esto quiere decir que una apuesta justa sería 8 a 2 a que el Once ganaría. Ganancia = -8 x 0.2 + 2 x 0.8 = 0 Interpretación frecuentista de probabilidad De este modo para un frecuentista, la definición de probabilidad sería: Definición: si un experimento que está sujeto al azar resulta de n formas igualmente probables y mutuamente excluyentes (es decir que ocurren bajo las mismas condiciones), y su nA de estos resultados tienen un atributo A, la probabilidad del atributo A es: Nota 1: A veces el futuro no se puede predecir y solo se puede calcular la probabilidad de que algo suceda. Nota 2: En el lanzamiento de un dado los resultados son mutuamente excluyentes y mutuamente probables. La probabilidad de obtener un 4 es 1/6. Esto no significa que en 6 tiradas tengamos necesariamente que obtener un 4. Nota 3: El desarrollo inicial de la teoría de probabilidades se asocia al estudio de los juegos de azar. Espacio muestral Ω ● ● ● ● Es el conjunto de todos los posibles resultados de un experimento aleatorio. Los elementos ω del conjunto Ω se denominan puntos muestrales. El espacio muestral Ω puede ser – Discreto (cardinalidad finita o infinita contable: los resultados pueden ponerse uno a uno con los números naturales) – Continuo (cardinalidad infinita no contable: los resultados consisten de intervalos de los números reales) Un evento (o suceso) del espacio muestral es un subconjunto de Ω cuyos miembros tienen una característica común. 17 Espacio muestral discreto ● 18 ● Las caras de un dado forman el espacio muestral Las especificaciones de un computador pueden especificarse en 1, 2 o 4 Gb de memoria y en 200, 300 o 400 Gb de disco duro, tienen el espacio muestral: Ω = {(1,200); (2,200); (4,200); (1,300); (2,300); (4,300); (1,400); (2,400); (4,400)} ● Cada uno de los cuatro bits transmitidos se clasifica como con error o sin error. ● s = sin error, c = con error El número de lanzamientos de una moneda hasta obtener caras tiene el espacio muestral Ω = {1, 2, 3, 4, ..., ∞} 19 20 Espacio muestral continuo ● ● El espacio muestral que representa la altura de una persona se puede especificar por el espacio muestral Ω = [0, 3] metros. El espacio muestral que representa el tiempo que se debe esperar la buseta se puede especificar por el espacio muestral Ω = [0, ∞) minutos. 21 Espacio muestral en experimentos con reemplazo y sin reemplazo Eventos ● ● ● ● 22 El espacio muestral Ω es un evento que se le llama el evento seguro El conjunto vacío Ø es un evento llamado el evento imposible Sean dos eventos A y B, si ambos son conjuntos disjuntos, entonces ellos son eventos mutuamente excluyentes. A una colección de eventos A1, A2, A3... (sea finita o infinita contable) se le conoce como eventos exhaustivos si su unión es el espacio muestral Ω. 23 24 Diagrama del árbol Sigma-algebra: motivación Cuando analizamos eventos aleatorios, generalmente no estamos interesados en Ω sino en un subconjunto E ∈ Ω. Cuando analizamos las probabilidades de ocurrencia del evento E, tambien nos interesan las probabilidades de la no ocurrencia del evento E. Además si nos interesa la probabilidad de ocurrencia de los eventos A1 y A2 también nos interesaría la probabilidad de su unión. 25 Sigma-álgebra 26 Ejemplos 27 28 Algunas definiciones Andrey Nikolaevich Kolmogorov Un par ordenado (X, σX), donde X es un conjunto y σX una σ-álgebra sobre éste, se denomina espacio medible. (Abril 25, 1903 – Octubre 20, 1987) Una función entre dos espacios medibles se denomina función medible si la preimagen de todo conjunto medible es también medible; esto es, si (X, σX) y (Y, σY) son dos espacios medibles, una función f:X→Y es medible si para todo E ∈ σY, f−1(E) ∈ σX. Una medida es una cierta clase de función que mapea puntos de una σ-álgebra al intervalo [0,∞). 29 Axiomas de probabilidad de Kolmogorov 30 Axiomas de probabilidad de Kolmogorov 31 32 Consecuencias de los tres axiomas de probabilidad Consecuencias de los tres axiomas de probabilidad 33 Consecuencias de los tres axiomas de probabilidad 34 Consecuencias de los tres axiomas de probabilidad 35 36 Ejemplos 37 38 Probabilidad conjunta ● Probabilidad marginal Cual es la probabilidad de ser mujer fumadora? ● B1 (hombre) B2 (mujer) B1 (hombre) B2 (mujer) A1 (fumador) A2 (no fumador) 14 40 Cual es la probabilidad de ser fumador? A1 (fumador) A2 (no fumador) 17 29 Suma sobre todos los j 39 14 40 17 29 Suma sobre todos los i 40 Probabilidad condicional ● Probabilidad condicional Cual es la probabilidad de ser fumador dado que se es mujer? ● B1 (hombre) B2 (mujer) A1 (fumador) A2 (no fumador) 14 40 Cual es la probabilidad de ser mujer dado que se es fumador? B1 (hombre) B2 (mujer) A1 (fumador) A2 (no fumador) 17 29 Probabilidad condicional de Ai dada la ocurrencia de Bj 14 40 17 29 Probabilidad condicional de Bj dada la ocurrencia de Ai 41 42 ● Diagrama del árbol En general, tenemos la regla de la multiplicación: ● 43 Para definir las probabilidades conjuntas, marginales y condicionales se ha empleado un ejemplo específico en el que el espacio muestral contiene un número finito de resultados. Sin embargo, las definiciones dadas aquí son completamente generales y pueden extenderse para cualquier espacio muestral, ya sea discreto o continuo. 44 Ejemplo La paradoja del falso positivo En una encuesta de televisión se determina que al 20% de las personas les gusta el programa A, al 16% de las personas les gusta el programa B y al 1% de les gusta ambos programas. Si se selecciona al azar un televidente de B(A), cual es la probabilidad que también le guste A(B)? 45 46 47 48 49 Propiedades de la probabilidad condicional 50 Ejemplos 51 52 Probabilidad condicional con varias variables aleatorias Ejemplo Una bolsa tiene 10 bolas blancas y 30 rojas. ¿Cuál es la probabilidad de muestrear BBRB? Muestreo sin reemplazo Muestreo con reemplazo 53 Ejemplo 54 Arboles de decisión 55 56 Ejemplo 57 58 Eventos independientes Ejemplo Una pareja planifica utilizando DemoProvera (confiabilidad = 99.7%/año) y condón de latex masculino (confiabilidad = 98%/año) simultáneamente. Si la probabilidad de quedar en embarazo al tener relaciones sin protección es del 85%/año, ¿cuál es la probabilidad de un embarazo no deseado? Porcentajes sacados de: http://en.wikipedia.org/wiki/Comparison_of_birth_control_methods 59 60 Eventos independientes Ejemplo Esto quiere decir que si la ocurrencia de B no tiene ningún efecto sobre la probabilidad de A, entonces se tiene que P(A|B)=P(A), a pesar que ha ocurrido el evento B. Dentro de la teoría matemática, sólo podemos probar la independencia de eventos obteniendo P(A), P(B) y P(A∩B) y demostrando que se verifica una de las ecuaciones anteriores marcadas en el recuadro. En la práctica de ingeniería, normalmente se confía en el conocimiento de la situación física para afirmar que en el modelo dos eventos particulares se supondrán (o no) independientes. 61 62 Ejemplo Nivel total de demanda Suponga que se quiere diseñar el acueducto de un parque industrial que tendrá dos fábricas. Supongamos que existen dos niveles de demanda de agua: W1 = 1 m3/min y W2 = 2 m3/min. La probabilidad que cualquier fábrica requiera dichos niveles de demanda son 0.3 y 0.7 respectivamente (P(W1)=0.3, P(W2)=0.7). Dichos niveles de demanda de ambas fábricas son estádísticamente independientes. P(W1W1) = P(W1)P(W1)=0.3 x 0.3 = 0.09 P(W1W2) = P(W1)P(W1)=0.3 x 0.7 = 0.21 0.42 P(W2W1) = P(W2)P(W1)=0.7 x 0.3 = 0.21 P(W2W2) = P(W2)P(W2)=0.7 x 0.7 = 0.49 1.00 2 = W 1W 1 3 = W 2W 1 3 = W 1W 2 4 = W 2W 2 ¿Cuál es la combinación de niveles de demanda menos probable? más probable? Fabrica 1 2 3 3 4 Fabrica 2 63 64 Si los costos de instalación inicial y de ensanche son los siguientes: Costos de instalación inicial: Dos unidades = $2500 Tres unidades = $3000 Cuatro unidades = $4000 Costo de ensanche: Dos a tres unidades = $1200 Tres a cuatro unidades = $1500 Dos a cuatro unidades = $2000 Que capacidad inicial instalaría usted de modo que el costo total esperado del proyecto sea el mínimo? Capacidad inicial Costo inicial 2 unidades 2500 3 unidades 3000 4 unidades 4000 Pérdida Pérdida esperada si esperada si se necesitan se necesitan Costo total 3 unidades 4 unidades esperado (0,21 + 0,21) 0.49 x 2000 = x 1200 = 504 980 3984 0 0.49 x 1500 = 735 3750 0 0 4000 Lo mejor será instalar 3 unidades = 3 m3/min 65 Regla de la multiplicación para eventos independientes 66 Ejemplo 67 68 Condere una red de acueducto. En el gráfico se muestra la configuración de la misma junto con la posición de las bombas A, B, C y D. Dado que la probabilidad de falla de dichas bombas es 0.2, 0.3, 0.1 y 0.05 respectivamente, calcule la probabilidad con la que el agua puede efectivamente transportarse desde el punto 1 hasta el punto 2. Tenga en cuenta que: 69 70 71 72 serie paralelo 73 Relación entre eventos independientes y eventos mutuamente excluyentes Propiedad de Markov ● ● 74 P(A|B,C) = P(A|B) independientemente de la ocurrencia de C Ver – http://en.wikipedia.org/wiki/Markov_chain – http://en.wikipedia.org/wiki/Examples_of_Markov_chains – http://en.wikipedia.org/wiki/Markov_property 75 76 Teorema de las probabilidades totales Para un chip se sabe que: 77 78 Teorema de Bayes Thomas Bayes (aprox. 1702 – Abril 7, 1761) Essay Towards Solving a Problem in the Doctrine of Chances (1764) 79 80 Ejercicio Suponga que tenemos dos urnas: A y B. Las cuales se muestran en la figura. En A hay siete bolas rojas (red - R) y tres bolas blancas (white - W). En B hay una bola roja y nueve blancas. Se lanza una moneda. Si caen caras se saca una bola de la urna A y si cae en sellos se saca una bola de la urna B. Si se lanzó la moneda y se sacó una bola roja, cual es la probabilidad que esta bola provenga de la urna A? 81 82 Problema de Monty Hall http://en.wikipedia.org/wiki/Monty_Hall_problem Supón que estás en el concurso de televisión Let's make a deal, y se te ofrece escoger entre tres puertas: detrás de una de ellas hay un coche, y detrás de las otras, cabras. Escoges una puerta, digamos la nº1, y el presentador, llamado Monty Hall, que sabe lo que hay detrás de las puertas, abre otra, digamos la nº3, que contiene una cabra. Entonces te pregunta: "¿No prefieres escoger la nº2?". ¿Es mejor para ti cambiar tu elección? 83 84 Problema de Monty Hall Problema de Monty Hall El jugador tiene inicialmente la probabilidad 1/3 de seleccionar inicialmente un carro, la cabra A o la cabra B. Cambiar incrementa la posibilidad de ganar a 2/3. 85 Problema de Monty Hall 86 Redes bayesianas 87 88 Conteo de datos con la ayuda del factorial Ejercicios Para calcular las probabilidades de varios eventos es necesario contar el número de resultados posibles de un experimento o contar el número de resultados que son favorables a un evento dado. El proceso de conteo puede simplificarse mediante el empleo de dos técnicas de conteo denominadas permutaciones y combinaciones. 89 Factorial 90 Factorial 91 92 Factorial en MATLAB Factorial en MS EXCEL Se calcula utilizando la función FACT FACTORIAL(N): como los números de doble precision solo almacenan 15 dígitos, la respuesta es exacta para N≤21. Si N>21, la respuesta solo será aproximada. 93 94 Permutación P(n,r) La función gamma Es el número de arreglos en un orden en particular de los elementos que forman un conjunto. De cuantas formas diferentes se pueden ubicar a, b y c? a b c Para la primera posición se escoje cualquiera de las a c b letras b a c Para la segunda posición se puede escoger dos b c a letras para la primera posición c a b Para la última posición se escoje la letra restante cba La función gamma en MS EXCEL y en MATLAB En este caso tenemos 3x2x1 = 6 posibilidades 95 96 Permutación P(n,r) Combinatoria C(n,r) De los objetos de un conjunto, es una selección de estos sin importar el orden. Se divide por r! ya que en cada combinación existen r! permutaciones 97 98 Ejemplo Combinatoria vs Permutación Supongamos que el grupo de probabilidad y estadística está formado por 35 estudiantes. Cuantos grupos de tres estudiantes podrían formarse para hacer un trabajo? La diferencia entre una permutación y una combinatoria es que en la primera el interés se centra en contar todas las posibles selecciones y todos los arreglos de estas, mientras que en la segunda el interés sólo recae en contar el número de selecciones diferentes. La solución es Ejemplo: abc y acb son diferentes permutaciones pero son iguales combinación de las letras 99 100 Ejemplo Permutación y combinación en MS EXCEL y MATLAB 101 102 Ejemplo Ejemplo 103 104 Ejemplo Problema del cumpleaños http://en.wikipedia.org/wiki/Birthday_problem Un grupo de n personas está reunido en una habitación, ¿qué tan probable es que dos o más de ellas cumplan años el mismo día? Supongamos que: ● ● no existen años de 366 días (bisiestos) los cumpleaños se distribuyen uniformemente a lo largo del año 105 Problema del cumpleaños 106 Problema del cumpleaños De acuerdo con este gráfico y para las hipótesis dadas, en un grupo de al menos 23 personas es probable encontrar con una probabilidad mayor del 50% dos personas que cumplan años el mismo día 107 108