Download varianza -según -"de 0"

Document related concepts

Distribución normal wikipedia , lookup

Distribución t de Student wikipedia , lookup

Varianza wikipedia , lookup

Estadístico muestral wikipedia , lookup

Distribución χ² wikipedia , lookup

Transcript
ESTADISTICA I CSH
1
M. EN C. GAL VARGAS
NERI
Planeación del curso
TEMA
CAP
.
TEMA 0
0
TEMA I
DÍA
S
SEM
FEC
FIN
MOTIVACION Y PLANEACION
1
1
11/01
1-2
ESTADISTICA Y MEDICION
2
1
15/01
TEMA II
2-3
BASES DE DATOS Y
ESTADISTICOS DESCRIPTIVOS
6
2-3
29/01
TEMA
III
4-5
DISTRIBUCIONES DE PROB.
6
4-5
15/02
Evaluación
1
6
17/02
INTRODUCCION A LA
INFERENCIA
2
6
22/02
TEMA V 7
DISTRIBUCIONES EN EL
MUESTREO
6
7
05/03
TEMA VI 8
ESTIMACION PUNTUAL DE
PARAMETROS
4
8
13/03
Segunda
Evaluación
1
9
15/03
ESTIMACION POR INTEVALO
5
9-10
26/03
Primer
TEMA
IV
TEMA
VII
5-6
8
TITULO
2
PLANEACION DE ESTADISTICA I CSH
TEMARIO
Proceso de Estimación
Población
, es
desconocida
Muestra
Muestra aleatoria
X = 50
Con un 95% de
confianza sé que
 está entre 40 y
60.
Estimación de Parámetros
Poblacionales
Estimador Poblacional
Parámetro...
Media

Proporción
Varianza
Diferencia
p

1
_
X
ps
2
 - 
Con muestra
Estadística
s
2
2
_
_
x - x
1
2
Distribución Normal
Éstas son
un número
infinito
Variación de los Parámetros  y , se obtiene
Distribuciones Diferentes de Normal.
El Modelo Matemático
f X  

1
2
2
e
1
2
2
X





f(X) =
frecuencia de variable aleatoria X

=
3.14159;

=
Desviación estándar de población
X
=
valor variable aleatoria (- < X < )

=
media de población
e = 2.71828
Distribución Normal:
Encontrando Probabilidades
Probabilidad es el
área debajo de la
curva¡
P (c  X  d )
f(X)
c
d
X
?
¿Cuál Tabla?
¿Cada distribución
tiene su propia
tabla?
¡Infinidad de Distribuciones Normales significa
infinidad de tablas para buscar!
Estandarización de una variable
aleatoria normal
Z
X 

x1


Distribución
Normal
, donde Z  N (0,1)
x2
X
z1 0
z2
Z
Distribución Normal
Estandarizada
Asignación de Normalidad
Compare las características de los datos con las propiedades
de la distribución normal
• Poner los datos en un arreglo ordenado
• Encontrar correspondencia con los cuartiles de la
distribución normal estandarizada
• Dibujar los pares de puntos
• Ajustar una línea recta
Ejercicios de Distribución Normal
1. Una fábrica de alimentos empaca productos cuyos pesos están
distribuidos normalmente con media de 450 gramos y
desviación estándar de 20 gramos. Encuentre la probabilidad
de que un paquete escogido al azar pese entre 425 y 486
gramos.
Solución
  = 450 gramos
  = 20 gramos
 P(425 < X > 486) = ?
Determinar la variable aleatoria relacionada
Ejercicios de Distribución Normal
Elaborar gráfica del problema
425 450 486
Cálculos
P ( 425 <X < 486 ) = P ( -1.25 < Z < 1.80 )
Ejercicios de Distribución Normal
Encontremos la probabilidad utilizando la tabla
P ( Z < 1.80 ) – P(Z < -1.25) = 0..9641 - .1056 = 0.8585
Entonces:
La probabilidad de que un paquete escogido al azar pese
entre 425 y 486 gramos es de 0.8585.
Ejercicios de Distribución Normal
2.
Cierto tipo de pieza para automóvil tiene un promedio
de duración de 3 años con una desviación estándar de 0.5
años. Suponga que la duración de las piezas esta distribuida
normalmente , encuentre la probabilidad de que una pieza
determinada tenga un tiempo de duración de más de 3.5
añosSolución
Datos
 = 3.0 años
 = 0.5 años
X > 3.5 años
Determinemos la variable aleatoria relacionada
Ejercicios de Distribución Normal
Elaborar gráfica del problema
3.0
Cálculo
P ( X > 3.5 ) = P ( Z > 1.0 )
3.5
Ejercicios de Distribución Normal
Encontremos la probabilidad utilizando la tabla
P ( Z > 1.0 ) = .5 - .3413 = 0.1587
Conclusión
la probabilidad de que una pieza determinada tenga un
tiempo de duración de más de 3.5 años es de 0.1587
Ejercicios de Distribución Normal
3.
En un examen la calificación promedio fue 3.5 y la
desviación estándar 0.3. Las calificaciones siguen una
distribución normal. a) ¿ Qué porcentaje de estudiantes tuvo
notas por debajo de 2.0? b) ¿ Qué porcentaje de estudiantes
tuvo notas por encima de 4.0.
Solución
Datos
 = 3.5
 = 0.3
X < 2.0
X > 4.0
Determinaremos la variable aleatoria relacionada
Ejercicios de Distribución Normal
Elaborar gráfica del problema
2.0
3.5
4.0
Cálculos
P ( X < 2.0 ) = P ( Z < -5.0 )
P (X > 4.0) = P (Z > 1.67)
Ejercicios de Distribución Normal
Encontrar la probabilidad utilizando la tabla
P ( Z < -5.0 ) = 0
P ( Z > 1.67) = .5 - .4525 = .0475
Conclusión
Ningún estudiante obtuvo calificaciones por debajo de 2.0 y
solamente el 4.75% obtuvo calificaciones por arriba de 4.0.
PROPIEDADES DE LA
DISTRIBUCIÓN JI- CUADRADA
1. Los valores de 2 son mayores o iguales que cero.
2. La forma de una distribución 2 depende de gl = n -1.
3. El área bajo una curva 2 y sobre el eje horizontal es 1
4. Las distribuciones 2 no son simétricas. Tienen colas estrechas que se extienden
hacia la derecha; esto es, están sesgadas hacia la derecha.
5. Cuando n > 2, la media de la distribución 2 es n -1 y la varianza es 2(n-1).
gl=3
gl=5
gl=10
Ji - cuadrada
un sólo parámetro
denominado grados de libertad.
 Tiene
 La función de densidad se hace
más simétrica incluso casi
gaussiana cuando aumenta el
número de grados de libertad.
 Normalmente
consideraremos
atípicos aquellos valores de la
variable de la “cola de la
derecha”.
Estimación de la Varianza
Para poder estimar la varianza de una población normal se utilizará
la distribución ji-cuadrada.
Al despejar esta fórmula la varianza poblacional nos queda:
Los valores de X2 dependerán de nivel de confianza que se quiera al
cual le llamamos
. Si nos ubicamos en la gráfica se tiene:
Ejemplos
1. Los tiempos requeridos por un autobús para llegar a su
destinos, sigue una distribución normal con desviación
estándar =1 minuto. Si se elige al azar una muestra de 17
tiempos, encuentre la probabilidad de que la varianza
muestral sea mayor que 2.
Solución:
Primero se encontrará el valor de ji-cuadrada
correspondiente a s2=2 como sigue:
Ejemplos..
El valor de 32 se busca adentro de la tabla en el renglón de 16
grados de libertad y se encuentra que a este valor le
corresponde un área a la derecha de 0.01. En consecuencia,
el valor de la probabilidad es P(s2>2)
Ejemplos..
2. Encuentre la probabilidad de que una muestra aleatoria de
25 observaciones, de una población normal con varianza
tenga una varianza muestral:
a. Mayor que 9.1
b. Entre 3.462 y 10.745
Solución.
a. Primero se procederá a calcular el valor de la ji-cuadrada:
 Al buscar este número en el renglón de 24 grados de
libertad nos da un área a la derecha de 0.05. Por lo que la
P(s2 >9.1) = 0.05
Ejemplos..
b. Se calcularán dos valores de ji-cuadrada:
y
Aquí se tienen que buscar los dos valores en el renglón de 24
grados de libertad. Al buscar el valor de 13.846 se
encuentra un área a la derecha de 0.95.
El valor de 42.98 da un área a la derecha de 0.01. Como se
está pidiendo la probabilidad entre dos valores se resta el
área de 0.95 menos 0.01 quedando 0.94.
Por lo tanto la P(3.462 s2 10.745) = 0.94
Ejemplos..
Por lo tanto la P(3.462 s2 10.745) = 0.94
Ejemplos..
3.Los siguientes son los pesos, en decagramos, de 10 paquetes
de semillas de pasto distribuidas por cierta compañía:
46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46.
Encuentre un intervalo de confianza de 95% para la
varianza de todos los paquetes de semillas de pasto que
distribuye esta compañía, suponga una población normal.
Solución:
Primero se calcula la desviación estándar de la muestra:
Ejemplos..
al elevar este resultado al cuadrado se obtiene la varianza de
la muestra s2= 0.286.
Para obtener un intervalo de confianza de 95% se elige un =
0.05. Después con el uso de la tabla con 9 grados de
libertad se obtienen los valores de X2.
Ejemplos..
Se puede observar en la gráfica anterior que el valor de X2
corre en forma normal, esto es de izquierda a derecha.
Por lo tanto, el intervalo de confianza de 95% para la varianza
es:
 Gráficamente:
 Se observa que la varianza corre en sentido contrario, pero
esto es sólo en la gráfica. La interpretación quedaría similar
a nuestros temas anteriores referentes a estimación. Con un
Ejemplos..
Gráficamente:
Se observa que la varianza corre en sentido contrario, pero
esto es sólo en la gráfica.
La interpretación quedaría similar a nuestros temas
anteriores referentes a estimación. Con un nivel de
confianza del 95% se sabe que la varianza de la población
de los pesos de los paquetes de semillas de pasto esta entre
0.135 y 0.935 decagramos al cuadrado.
Distribución t de Student
Normal
Estándar
t (lg = 13)
Campana
Simétrica
t (lg = 5)
0
Z
t
Grados de Libertad (lg)
 El número de observaciones que son libres de variar
después de que la media de la muestra ha sido
calculada.
 Ejemplo:

Media de 3 números es 2
X1 = 1 (o cualquier número)
X2 = 2 (o cualquier número)
X3 = 3 (no puede variar)
media = 2
Grados de libertad =
n -1
= 3 -1
=2
Grados de Libertad (lg)
Supóngase que se toma una muestra de una población
normal con media
y varianza . Si es el
promedio de las n observaciones que contiene la
muestra aleatoria, entonces la distribución
es una distribución normal estándar. Supóngase que la
varianza de la población 2 es desconocida. ¿Qué
sucede con la distribución de esta estadística si se
reemplaza
por s? La distribución t proporciona la
respuesta a esta pregunta.
 La media y la varianza de la distribución t son
=0y
para >2, respectivamente.
Grados de Libertad (lg)
Supóngase que se toma una muestra de una población
normal con media
y varianza . Si es el
promedio de las n observaciones que contiene la
muestra aleatoria, entonces la distribución
es una distribución normal estándar. Supóngase que la
varianza de la población 2
es desconocida. ¿Qué sucede con la distribución de esta
estadística si se reemplaza
por s? La distribución t
proporciona la respuesta a esta pregunta.
 La media y la varianza de la distribución t son = 0 y
 Ejemplo:
 Un ingeniero químico afirma que el rendimiento
medio de la población de cierto proceso en lotes es
500 gramos por milímetro de materia prima. Para
verificar esta afirmación toma una muestra de 25
lotes cada mes. Si el valor de t calculado cae entre –
t0.05 y t0.05, queda satisfecho con su afirmación. ¿Qué
conclusión extraería de una muestra que tiene una
media de 518 gramos por milímetro y una desviación
estándar de 40 gramos? Suponga que la distribución
de rendimientos es aproximadamente normal.
 Solución:
Tabla t de Student
Área Superior de la Cola
df
.25
.10
.05
1 1.000 3.078 6.314
Considere: n = 3
df = n - 1 = 2
 = .10
/2 =.05
 / 2 = .05
2 0.817 1.886 2.920
3 0.765 1.638 2.353
0
Valores t
2.920
t