Download 4-Probabilidad

Document related concepts
no text concepts found
Transcript
Estadística Analítica: Conceptos
básicos de probabilidad y
distribución de probabilidad.
Temas:
•
•
•
•
•
•
Conceptos de probabilidad
Propiedades de la probabilidad
Distribuciones de probabilidad de variables aleatorias
Variable aleatoria discreta y continua
Distribución de probabilidad de una variable aleatoria discreta
Distribución binomial como ejemplo de la distribución de una
variable aleatoria discreta.
• Distribución de probabilidad de una variable aleatoria
continua: Función de densidad.
• Modelo Normal, descripción y características.
2 semanas
Parentesis
Espacio Muestral
• Se llama espacio muestral al conjunto de todos los resultados
posibles de un proceso experimental u observacional. Será
denotado con la letra griega omega (Ω).
• Ejemplo: Considérese un experimento que consta de la
observación de 3 semillas en un cierto orden, cada una de las
cuales puede estar sana (situación que se representará con el
signo “+”) o bien enferma (situación que se representará con
el signo “-”). Hay 8 resultados posibles en el experimento, los
que conforman un conjunto que se denomina espacio
muestral y que a continuación se representa:
Ω = {+ + + , + - - , + + - , - - + , + - + , - + - , - + + , - - -}
Punto muestral
• Se llama punto muestral o evento elemental a cada uno de
los elementos del conjunto Ω y será denotado genéricamente
como: ω.
• Ejemplo: un punto muestral es el resultado posible “tres
semillas sanas” (representado por ω = (+ + +)), otro punto
muestral es “la primera semilla sana y las otras dos no” (ω = (+
- -)).
• EVENTO: Dado un espacio muestral Ω, se llama evento a
cualquier subconjunto de Ω.
• Ejemplo: Un evento de Ω, puede ser “observar una semilla
cualquiera sana y las otras no”. Este evento esta constituido
por los siguientes puntos muestrales:
A = {+ - - , - + - , - - +}.
Eventos mutuamente
excluyentes
Ejemplo: Tirar un dado y obtener 4 y 5, en un solo lanzamiento, ¿se puede ser
macho y hembra al mismo tiempo?
Pero…
Ejemplo eventos que no son mutuamente excluyentes: En el clima, que llueva y
haga sol, ser veterinario y al tiempo musico, etc.
Probabilidad
• Es una medida entre 0 y 1 que se aplica a eventos o
sucesos (conjuntos). Es intuitivamente un valor
limite con que ocurre un suceso (Ejm: cara de la
moneda ½). Hacer experimento de la moneda, con 2
lanzamientos, 10 lanzamientos y 40 lanzamientos.
• Medido como el número de casos “favorables” sobre
el número de casos posibles.
• se llama medida de probabilidad si satisface los
siguientes axiomas:
Axiomas
• i. P(Ω) =1
• ii. P(A) ≥ 0, donde A representa un evento cualquiera de Ω
• iii. Si A1, A2, ... es una secuencia de eventos mutuamente
excluyentes entonces: P (Ui Ai) =Σ P (Ai) .
Ejemplo
• Considérese que la observación de una semilla es un ensayo.
Suponga que con A se representa el evento “encontrar la
semilla germinada”. Si se observan 1000 semillas (se repite
1000 veces el ensayo, N = 1000), en condiciones tales que
cada observación sea independiente una de otra y si 600
semillas germinan (nA = 600), se dice que la probabilidad
estimada de observar una semilla germinada, está dada por:
P(A) = P(observar una semilla germinada) =nA/N = 600 / 1000 = 0.6
• En este caso se habla de probabilidad estimada o aproximada
por una cierta proporción ya que se usó la noción de límite
para calcular P(A).
• La noción de límite para N→ ∞ debe ser interpretada para “N
suficientemente grande”.
ejercicio
• ¿Cual es la probabilidad de que al lanzar un dado una vez
obtenga un número par?
• Ω = {1, 2, 3, 4, 5, 6 }.
• Si p(w)=1/6, entonces el evento de interés (A) es “que salga un
número par” A={2,4,6}, tenemos que:
• P(A)=1/6+1/6+1/6=3/6=0,5
Suma de probabilidades
• Hay dos reglas prácticas que se usan constantemente:
• La probabilidad de un suceso es la suma de las
probabilidades de los eventos que lo componen.
• P(A ó B)=P(A)+P(B), siempre que A y B no puedan ocurrir
al mismo tiempo (mutuamente excluyentes).
• La regla general es:
• P(A ó B)=P(A)+P(B)-P(A y B)
• Si P(A y B)=0 los eventos son mutuamente excluyentes.
• Ejemplo: Al tirar un dado, cual es la probabilidad de
obtener en el primer lanzamiento 4 ó 5?.
Eventos mutuamente excluyentes
• Son eventos donde la ocurrencia de uno excluye la
ocurrencia del otro.
• La solución de problemas que involucran eventos
mutuamente excluyentes, señalan que la suma de
probabilidades debe ser realizada.
• Ayuda: Usualmente se usa la conjunción “o” en sus enunciados para refererirse a
eventos mutuamente excluyentes
• Ejemplo: En dos lanzamientos de una moneda hay
dos maneras de obtener cara y sello
Primer manera: cara (p=1/2) y Sello (q=1/2); Pr=1/2*1/2=1/4
Segunda manera: sellos (q=1/2) y cara (p=1/2); Pr=1/2*1/2=1/4
La probabilidad combinada es= ¼+ ¼ = ½
Es decir, que se puede obtener cara y sello en dos lanzamientos, de la primer
manera o la segunda
Multiplicación de
probabilidades
• La probabilidad de que ocurra A y B simultaneamente
es la probabilidad de que ocurra A dado B
(condicional) por la probabilidad de B.
• P(A y B)= P(A|B)P(B),
• Pero, si A y B son independientes P(A|B)=P(A),
entonces:
• P(A y B)=P(A)*P(B).
• Ejemplo: ¿cual es la probabilidad de que al lanzar una
moneda obtenga cara y que acto siguido lance un
dado y obtenga un 5?
Combinación de probabilidades
• Dos eventos son independientes si la ocurrencia de uno no
afecta la del otro.
• Cuando dos eventos independientes ocurren con una
probabildiad p y q respectivamente, entonces la
probabilidad de su ocurrencia conjunta es p*q.
•
Ayuda: Si la conjunción “y” es usada en la frase del problema la asunción de independencia es pertinente.
• Ejemplo: Un genetista le dice a una pareja que la
probabilidad de que su hijo tenga ojos azules es del 20% y
que la probabilidad de que sea rubio es del 40%. ¿cuál es
la probabilidad de que el hijo sea rubio y tenga ojos
azules?, ¿cuál es la probabilidad de que sea rubio y no
tenga ojos azules?
Ejercicio
1) Al lanzar una moneda “legal” hay igual probabilidad
de tener cara o sello (p=1/2, q=1/2). Si se lanza la
moneda dos veces. ¿Cual es la probabilidad de
sacar dos sellos?
2) En el cruce en el cerdo de guinea (Bb x bb),
sabemos que a probabilidad de tener individuos
negros (Bb) es de p=½ y blancos (bb) de q=½. ¿cuál
es la probabilidad de tener los dos primeros hijos
blancos?
El baloto
• Se gana el premio mayor si se aciertan 6 números
determinados elegidos de un conjunto de 45. el jugador elige
6 números como lo muestra la imagen.
A jugar el baloto
• Para ganar no existe ningún orden entre las cifras. Si las
balotas en el día del sorteo son: {5,14,26,28,35 y 44},
¡ganaste!
• Se debe tener en cuenta que cualquiera de los conjuntos de 6
números es igual de probable. Puede expresarse la
probabilidad de hacerse millonario jugando el baloto así:
• El valor del numerador es 1. Un conjunto de datos
{5,14,26,28,35 y 44}
• Y el denominador?
Número total de posibles
conjuntos
• El número de posibles conjuntos de seis números es muy
grande.
• Es impractico mirar todos los posibles conjuntos para ontarlos.
Pero, ¡existe una formula que permite hacertlo rapidamente!.
• La formula de una combinatoria: ¿cuántos conjuntos de 6
elementos pueden construirse a partir de 45 elementos, si no
importa el orden de los elementos?
æ n ö
n!
45!
45!
=
=
=
= 8`145.060
ç
÷
è x ø x!(n - x)! 6!(45 - 6)! 6!(39)!
En caso que el orden de los elementos que conforman el conjunto, fuera
importante, esto es si, {1,2,3,4,5,6} es diferente de {6,5,4,3,2,1}, se utilizan
permutaciones
en
vez
de
combinaciones.
45P6=45!/(456)!=45!/39!=5864443200
Baloto
• P(ganar)=1/8`145.060=0.000000123,
• ¡Es mejor buscar la riqueza de otro modo!
• Si bien resulta entretenido calcular este tipo de
probabilidades, no nos sirve mucho para la investigación.
• En investigación nos interesa saber cosas como: ¿cuál es la
probabilidad de obtener individuos que produzcan más de 25
litros de leche por día?
• Por eso es importante definir otros tipos de probabilidad, por
lo que antes hay que plantear algunas definiciones.
Experimento aleatorio
• Es cualquier acción que genera una respuesta cuyo resultado
no es previsible con antelación.
• Ejemplo1: Lanzar un dado y anotar el resultado
• Ejemplo 2: Medir la leche por día en una vaca y anotarla
• Ejemplo 3: Revisar el envés de una hoja y contar el número de
huevos de un insecto.
• Variable aletoria: Función que asigna un número real a cada
uno de los elementos del espacio muestral.
• Variable aleatoria discreta: Tiene en cuenta escalas en los
enteros positivos, incluso en categorías.
• Variable aleatoria continua: Tiene en cuenta escalas reales.
Distribución acumulada
• Se denota por f(x) y asocia cada número de la variable
aleatoria X a cada número real x de la probabilidad p(X<x).
• La función de distribución acumulada, o simplemente función
de distribución, de una variable aleatoria X, denotada por F(.),
es una función F:ℜ→[0,1] tal que: F(x) = P([X ≤ x]) ∀ x ∈ ℜ.
• FUNCIÓN DE DENSIDAD: Define la probabilidad de tomar un
determinado valor
• Permite saber la probabilidad de que X=x que en el caso de
una variable aleatoria continuas P(X=x)=0 y en las discretas
P(X=x)>=0.
Distribución de una variable
aleatoria
• Considere el experimento aleatorio que consiste en lanzar 3
monedas y anotar el número de sellos.
f(x) es una función que asigna una probabilidad entre 0 y 1 a cada
uno de los posibles valores de la variable aleatoria X.
Función de masa de
probabilidad
• Algunas funciones masa de probabildiad (variables discretas),
pueden expresarse en forma tabular, así:
¿Y acumulada?
• Una función de masa de probabilidad debe satisfacer las
siguientes condiciones:
• Aunque existen muchas funciones, sólo unas cuantas son
usadas para modelar fenomenos naturales; nos concentramos
en unas de ellas
Distribución binomial
• Es una distribución discreta con valores 0 y 1. Cuenta el
número de exitos en una secuencia de n ensayos Bernoulli
inependientes entre sí, con una probabilidad p de
ocurrencia del éxito y q=(1-p) del fracaso. La variable
aleatoria binomial contabiliza el número de éxitos.
• Se requiere independencia entre experimentos Bernoulli.
• Ejemplos: Concepción (1=sí, 0=no), Tiene un genotipo, etc
• La probabilidad de que la variable tome un valor X es:
P(X=x)=
, donde:
Los experimentos Bernoulli dependiente, dan lugar a un experimento Hipergeométrico y no Binomial, a
no ser que el tamaño de la muestra sea muy grande y no haya un efecto importante de la dependencia.
Ejemplo: Dist Binomial
• Supongamos que la probabilidad de encontrar el
genotipo (-/-) en el gen bGH para el ganado Holstein
es de 0.3. Si tomamos 60 animales al azar, cual es la
probabilidad de obtener el genotipo (-/-) 25 veces.
• En este caso tenemos X~B(n,p)X~B(60, 0.3)
æ 60 ö
P(X = 25) = ç
÷ (0.30)25 (1- 0.30)60-25 = 0.016
è 25 ø
• Para esto hay calculadoras en internet:
http://stattrek.com/online-calculator/binomial.aspx
Ejercicio
• Cual es la probabilidad de obtener más de 25? ¿y
menos de 25?
Ejemplo
• Se someten 3 insectos a la acción de un insecticida y se
evaluan sus estados (vivo o muerto) después de 10 minutos.
• Éxito: muerto
• Fracaso: vivo
• El espacio muestral del experimento es:
• S={vvv, vvm, vmv, mvv, vmm, mvm, mmv, mmm}
• ¿Cual es la probabilidad de que todos esten vivos? Teniendo
en cuenta que la probabilidad de éxito según el fabricante es
0.8.
La esperanza de una variable aleatoria esta dada por E(X)=np y la varianza V(X)=npq
Función de densidad de una
variable aleatoria continua
Distribución Normal o de Gauss
• La mayoría de los caracteres cuantitativos ó métricos de
interés en el mejoramiento animal siguen esta
distribución. Los parámetros que lo caracterizan son la
media (μ) y la desvición estandar (σ).
• Si se consideran dos variables simultaneamente, se llama
distribución binormal y si se tratan más de dos se lama
multinormal, con un parámetro adicional llamado
covarianza entre las variables (σXY).
• La distribución normal es simetrica
Distribución normal
Tiene la propiedad de contener 68,27% de las observaciones
entre μ +/- σ; 95,45% entre μ +/- 2σ y 99,37% en el intervalo
μ +/- 3σ
Distribución Normal
Para un carácter determinado, las poblaciones pueden
tener diferente media y diferente varianza, o igual
media y diferente varianza ó igual varianza y diferente
media. Comparar
D
A
B
E
C
Curva Normal
Existen infinitas distribuciones normales. Cada una de ellas
queda especificada por los parámetros μ y σ2. Es por ello que
cuando se quiere indicar que una variable X tiene distribución
normal caracterizada por μ (esperanza) y σ2 (varianza) se
escribe:
X ∼ N (μ,σ2)
Estandarización
• Para entenderlo se plantea el siguiente ejemplo:
• supóngase que la longitud de las alas de la mosca de los
frutos tiene función de densidad normal y que la longitud de
las alas de gallinas también. Sin embargo sus parámetros son
distintos y es de esperar que el promedio de las alas de las
moscas sea menor al de las gallinas.
• Para tratar estos valores se usa una transformación que hace
que variables aleatorias con funciones de densidad normal
diferentes, se distribuyan de la misma manera bajo la
transformación. Facilitando así los cálculos de probabilidades
Estandarización
Normal estandar
• Para calcular la probabilidad de que un valor se
encuentre entre dos limites dados (Intervalo de
confianza), es posible estandarizar las variables
X~N(μ,σ) a una normal con media 0 y desviación
estándar 1, así:
• X*=Z= (X-μ)/σ ≈ N(0,1)
¡Cuidado!
Hay acumuladas o por colas
Ejemplo:
• Si X ~ N (μ,σ2) con μ = 10 y σ2 = 4 y se desea conocer la P [ 8 ≤
X ≤ 9 ] se procede de la siguiente manera:
1. Se estandariza de modo que queda: z1 =8-10/2= -1 y
z2 =9-10/2= - 0.5
2. Luego: A = P [ 8 ≤ X ≤ 9 ] = P [ -1 ≤ Z ≤ -0.5 ] = B, ilustrado en
la siguiente figura:
Ejemplo (Continuación)
3. Calcular B = P [ -1 ≤ Z ≤ -0.5 ] como se explica a
continuación:
• Para encontrar el valor del área sombreada en el gráfico
anterior, deberíamos resolver una integral, afortunadamente
las integrales acumuladas de la normal estandar están
calculadas en tablas, por lo tanto sólo es necesario hacer un
resta de las probabilidades acumuladas (TABLAS).
• B = P [ -1 ≤ Z ≤ -0.5 ]=P[Z≤-0.5]-P[Z≤-1]=0.2912-0.1469=0.1443,
• Osea que es 14.43%
Ejemplo 2
• La altura de la cruz de novillas Brangus (270 días) se
distribuye normalmente con media de 120 cm y una
desviación estandar de 14 cm. ¿cuál es la
probabilidad de encontrar una novilla de menos de
100 cm?
• Definir α, que generalmente es 0.05.
• Z=(100-120)/14= -1.428
• Entonces, buscando en las tablas:
• P(x<100)≈0.07, es decir, que la probabilidad de
obtener un valor menor de 100 cm es del 7%.
Menos mal este no es ese 50%