Download DISTRIBUCIONES DE PROBABILIDAD (RESUMEN) Binomial

Document related concepts

Distribución χ² wikipedia , lookup

Varianza wikipedia , lookup

Distribución normal wikipedia , lookup

Distribución t de Student wikipedia , lookup

Teorema del límite central wikipedia , lookup

Transcript
DISTRIBUCIONES DE PROBABILIDAD (RESUMEN)
VARIABLE ALEATORIA: un experimento produce observaciones numéricas que varían de muestra a
muestra. Una VARIABLE ALEATORIA se define como una función con valores numéricos definida
sobre un espacio muestral. Y es aleatoria porque los valores implican un suceso numérico
aleatorio.
CLASIFICACIÓN.
VAR. ALEA. DISCRETA.-es una variable que solo puede asumir un conjunto numerable de valores.
Ejemplos: el número de tornillos en un lote de una producción industrial, el número de hogares
que tienen luz eléctrica en cierta zona, el número de personas en una fila que compraran su boleto
para una función de cine, etc.
VAR. ALEA. CONTINUA.- es una variable que puede asumir el número infinitamente grande de
valores correspondientes a los puntos sobre un intervalo de línea recta.
Ejemplos: La estatura de una persona, la presión arterial, tiempo de vida de una célula, volumen
de lluvia que cae en un día en una selva, la resistencia a la tensión, en kilos por centímetro
cuadrado, de un cable de acero de 1 cm de diámetro.
Distribuciones de probabilidad para var. alea. discretas; binomial, hipergeométrica, geométrica,
poisson.
Distribuciones de probabilidad para var. alea. continuas; normal, gamma, exponencial, t-student,
chi-cuadrada y F- snedecor.
Para cada distribución se deben conocer sus propiedades y aprender a utilizar las tablas de
distribución que faciliten el cálculo de las probabilidades.
DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS DISCRETAS
Binomial

El experimento consiste en n intentos repetidos

Los resultados de cada uno de los intentos puede ser éxito o fracaso

La probabilidad de éxito “p”, permanece constante para todos los intentos.

Los intentos repetidos son independientes.

Formula b(x, n, p) = xCn px qn-x donde x: 0, 1, 2, …n
1
Ma. Guadalupe Medina Torres, E A 2010
µ = np σ2 = npq
Hipergeométrica

Una muestra aleatoria de tamaño n se selecciona sin reemplazo de un total de N
resultados o artículos totales.

K resultados o artículos del total de N pueden clasificarse como éxitos y N – K como
fracasos

Fórmula h(x, N, N, k) = KCX
k/N)
(N – K) C (n – x)
/ Nc n
µ = nk/N
σ2 = (N-n) / (N-1) . n . k/N (1-
Geométrica

Si repetidos intentos independientes pueden resultar en un éxito con una probabilidad p y
en un fracaso con una probabilidad de q = 1-p, entonces la distribución de probabilidad de
la variable aleatoria X, el número del intento en el cual ocurre el primer éxito es:

g(x, p) = p qx-1 donde x= 1, 2, 3,… µ = 1 / p σ2 = (1-p) / p2
Poisson

La distribución de probabilidad de la variable aleatoria de Poisson X, que representa el
número de resultados que ocurren en un intervalo de tiempo dado o región específica
indicado por t, es:

p(x, µ) = p(x, t) = e-t (t) x / x! x: 0, 1, 2, …. Donde t es la tasa promedio de
resultados por unidad de tiempo o región y e = 2.71828…

µ = σ2 = t

Cuando n tiende a ∞ y p tiende a 0 y µ = np permanece constante: se aproxima binomial a
la poisson, esto es b(x, n, p) →p(x, µ)
DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS CONTINUAS
Distribución normal o gaussiana
 La función de densidad de la curva normal está definida por la siguiente ecuación:
1
F(x) =
2
2
(-1/2)[(x- )/]
e
Ma. Guadalupe Medina Torres, E A 2010
2



La curva normal tiene forma de campana. La media, la moda y la mediana de la
distribución son iguales y se localizan en el centro de la distribución. La distribución de
probabilidad normal es simétrica alrededor de su media. Por lo tanto, la mitad del área
bajo la curva está antes del punto central y la otra mitad después. El área total bajo la
curva es igual a 1.
La curva normal se aproxima de manera asintótica al eje horizontal conforme se aleja de la
media en cualquier dirección. Esto significa que la curva se acerca al eje horizontal
conforme se aleja de la media, pero nunca lo llega a tocar.
La distribución normal estándar.
z=
x–

TIPIFICACIÓN
3
Ma. Guadalupe Medina Torres, E A 2010
Por tanto su función de densidad es
y su función de distribución es
siendo la representación gráfica de esta función
a la variable Z se la denomina variable tipificada de X, y a la curva de su función de densidad curva
normal tipificada.
Característica de la distribución normal tipificada (reducida, estándar)
4
Ma. Guadalupe Medina Torres, E A 2010





No depende de ningún parámetro
Su media es 0, su varianza es 1 y su desviación típica es 1.
La curva f(x) es simétrica respecto del eje OY
Tiene un máximo en este eje
Tiene dos puntos de inflexión en z =1 y z = -1

Si x es una variable aleatoria binomial con µ = np σ2 = npq, entonces la forma de límite
de la distribución de :
z=
x–

Cuando n →∞, es la distribución normal estándar n(z, 0, 1)
Distribución t-student







Es una distribución de probabilidad que surge del problema de estimar la media de una
población normalmente distribuida cuando el tamaño de la muestra es pequeño n≤ 30 y la
desviación estándar poblacional no se conoce.
Es una distribución continua.
Tiene forma de campana.
La distribución t tiene una media de cero, es simétrica respecto de la media. y se extiende
hasta el infinito en ambas direcciones.
No hay una distribución t, sino una "familia" de distribuciones t. todas con la misma media
cero, pero con su respectiva desviación estándar diferente de acuerdo con el tamaño de la
muestra n.
La distribución t es más baja y dispersa que la distribución normal. Cuando el tamaño de la
muestra se incrementa, la distribución t se aproxima a la normal.
Su función de densidad es:
f(t)=
5

 
(1+
t²


)
Ma. Guadalupe Medina Torres, E A 2010

-µ
T=
s
n

Con grados de libertad ν = n - 1
Grados de Libertad
Los grados de libertad son el número de valores que se pueden elegir libremente para
llegar a un resultado, por ejemplo, supongamos que tenemos una muestra de tres
elementos, la cual tiene una media de 8.
a+b+c
=8
3
Para asignar valores a los elementos que forman la muestra, podemos hacerlo libremente
en dos de ellos pero al asignar el valor al tercero debemos hacer un cálculo para que el
resultado sea correcto. Entonces se dice que hay 2 grados de libertad, porque dos valores
(n - 1) se asignaron libremente y uno en función de los otros valores y el resultado.
6
Ma. Guadalupe Medina Torres, E A 2010
Distribución chi cuadrada

La distribución chi cuadrada es una curva asimétrica a la derecha, se dice que tiene sesgo
positivo.

Se utiliza en estadística inferencial para pruebas de hipótesis.
 Teorema. Si
y S2 son la media y la varianza de una muestra (n) tomada de
una población normal con media  y varianza 2, entonces
 a)
y S2 son independientes.
 b) La variable aleatoria
tiene una distribución Chi Cuadrado con n-1
grados de libertad.
 Tabulación. La función de distribución no puede calcularse en forma analítica;
sin embargo, ha sido tabulada para diferentes valores de la probabilidad
acumulada, y para varios grados de libertad. En algunas tablas se presenta la
cola hacia la izquierda (probabilidad acumulada), y en otras la cola hacia la
derecha.
 Notación. Usaremos la notación
para denotar el valor de la distribución Chi
cuadrado con  grados de libertad y una cola de P o α hacia la derecha (o una
probabilidad acumulada de 1- α hacia la izquierda).
 Problema: Haciendo uso de la relación existente entre las distribuciones gama
y chi cuadrado, demuestre que la varianza de la varianza poblacional está dada
por

Ejemplo. Suponga que el espesor de un componente de un semiconductor es
una dimensión crítica. El proceso de producción de tal característica se
distribuye normalmente con una desviación estándar de 0.6 milésimas de
pulgada. Para controlar el proceso se toman muestras periódicas de veinte
7
Ma. Guadalupe Medina Torres, E A 2010

piezas, y se define un límite de control con base en una probabilidad de 0.01 de
que la varianza muestral exceda dicho límite, si el proceso está bajo control.
Qué se puede concluir si para una muestra dada la desviación estándar es 0.84
milésimas de pulgada?
 Solución. La variable aleatoria de interés para nuestro caso es
.
Si denotamos por LSC el límite superior de control, entonces tenemos que se
debe cumplir que:

 Por lo tanto, debemos buscar en la tabla de la distribución Chi Cuadrado, con 19
grados de libertad, el valor que tenga una probabilidad hacia la derecha de 0.01
(ó hacia la izquierda de 0.99), denotado por
el cual debe satisfacer la siguiente desigualdad:
 Se
O
acepta
también
, correspondiente a 36.19,
si
se
acepta
si
Por lo tanto el criterio de decisión se puede expresar en una de las dos formas
siguientes:
 a)

Se
calcula
=
Como X2 = 37.24 > 36.19  la muestra no proviene de un proceso con una
desviación estándar de 0.60.
b) Se calcula S2 = .842 = 0.7056. Como 0.7056 > 0.6857 se llega a la misma
conclusión de que no es probable que la muestra tomada provenga de una
población con una desviación estándar de 0.60 milésimas de pulgada.
Distribucion F- Snedecor o Fisher-Snedecor
DISTRIBUCIÓN F
Es la distribución muestral aplicable para la relación de dos varianzas.
Teorema. Si U y W son dos variables aleatorias independientes, cada una con
distribución Chi Cuadrado con1 y 2 grados de libertad, respectivamente, entonces la
distribución
de
la
siguiente
variable
aleatoria
8
Ma. Guadalupe Medina Torres, E A 2010
está
dada
por:
y se denomina "distribución F con 1 y 2 grados de libertad" (1 grados de libertad en
el numerador y 2 grados de libertad en el denominador).
Notación. Usaremos la notación
para denotar el valor de la distribución F con
1 grados de libertad en el numerador, 2 grados de libertad en el denominador y una
probabilidad acumulada de P o α hacia la derecha (o una probabilidad de 1-P(1- α)
hacia la izquierda). Puede demostrarse que
de la distribución F.
, si se invierte la definición
La aplicación principal para la cual se desarrolló la distribución F es la
comparación de dos varianzas (de poblaciones normales).
Sea
una muestra aleatoria (n1) tomada de una población normal con
varianza
, y sea
otra muestra aleatoria (n2) tomada de una
población normal con varianza
. Si queremos realizar alguna inferencia sobre la
igualdad o no de las varianzas, nos podemos basar en el hecho que las siguientes
relaciones
son variables aleatorias con distribuciones Chi cuadrada con1 y 2 grados de libertad,
respectivamente, y con las cuales podemos construir la distribución F. El siguiente
teorema clarifica este aspecto.
Teorema. Si
y
son las varianzas muestrales de dos variables aleatorias
independientes de tamaños n1 y n2 tomadas de poblaciones normales con varianzas
y
, entonces, la relación
tiene una distribución F con n1 -1 y n2 -1 grados de libertad.
9
Ma. Guadalupe Medina Torres, E A 2010
Tabulación. De nuevo, la función de distribución no puede calcularse en forma
analítica; sin embargo, ha sido tabulada para diferentes valores de la probabilidad
acumulada, y para varios grados de libertad en el numerador y en el denominador.
Para cada valor de la probabilidad debe calcularse una tabla diferente. Los valores de
las probabilidades dados en las tablas corresponden a las probabilidades de exceder los
respectivos valores de F, es decir, presentan las colas a la derecha del valor respectivo
de F. Las tablas están construidas bajo la suposición de que la distribución original de
las variables aleatorias es normal.
10
Ma. Guadalupe Medina Torres, E A 2010