Download Clase 11 IC para la estimación de la media - U

Document related concepts

Estimador wikipedia , lookup

Distribución t de Student wikipedia , lookup

Corrección de Bessel wikipedia , lookup

Estadístico muestral wikipedia , lookup

Error estándar wikipedia , lookup

Transcript
Sesión 11
Intervalo de Confianza para la
estimación de la media
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Media de una población normalmente
distribuida con varianza desconocida
• En la mayoría de las situaciones será difícil conocer la
varianza de una población.
• En este contexto “se presenta el problema de sustituir
los valores numéricos de la varianza cuando se desea
obtener un IC para la media” (Daniel, 1988, pag 151).
• La desviación típica de la muestra se utiliza para estimar
la desviación poblacional sigma.
• Ello implica que en vez de trabajar con Z se debe utilizar
la distribución t de student con n-1 grados de libertad.
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Media de una población normalmente
distribuida con varianza desconocida

S0
S0 
I .C  X 0 − t α ⋅
≤ µ ≤ X0 + t α ⋅
= 1−α

1− ; n −1
1− ; n −1
n
n
2
2

• Este es el IC para la media con una probabilidad de 1 – alfa
• El valor t teórico se obtiene de la tabla.
• S0 indica la desviación típica de la muestra escogida.
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Ejercicio 1: Uso de la Tabla t
Determine los valores t teóricos cuando:
•
•
•
•
•
•
Tamaño muestral (n) = 2; Nivel de confianza de 95%.
Tamaño muestral (n) = 2; Nivel de confianza de 99%.
N = 31, Nivel de confianza de 95%.
n = 31; Nivel de confianza de 99%.
n = 100; Nivel de confianza de 95%.
n = 100; Nivel de confianza de 99%.
• N= ∞ ; Nivel de confianza de 95%.
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Ejercicio 2:
IC para la estimación de la media
• Se desea establecer el tiempo promedio de
respuesta de los jóvenes universitarios ante un
estímulo visual.
• Con dicho fin se evalúa a 25 alumnos de la
carrera.
• El tiempo medio de los jóvenes fue de 160
milisegundos
• La desviación típica alcanzó los 5 milisegundos.
• Actividad: Construya el I.C. para la media con
un nivel de confianza del 99%
•Valor t = 2.7969
•RESULTADO: Límites del IC: 157 - 163
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Media de una población
no distribuida normalmente
• No siempre es posible asumir que la población a la que deseamos
estimar sus parámetros se encuentra distribuida normalmente .
• Hemos de conocer procedimientos de construcción de I.C para
estimar parámetros de poblaciones no normales.
• El desarrollar un muestreo en este tipo de población conduce a
dos situaciones: (a) la muestra es pequeña (b) la muestra es
grande.
• ¡Recordar el teorema del límite central!
• La distribución muestral de las medias no es normal cuando las
muestras son pequeñas; por lo tanto, no se puede construir el I.C
para la media con los procedimientos revisados hasta este
momento.
• “cuando las medias muestrales se calculan a partir de muestras
grandes, el valor z se distribuye de forma aproximadamente
normal con media 0 y varianza 1, sin importar la forma de la
población de la muestra” (Daniel, 1988, pag. 153)
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Media de una población
no distribuida normalmente
• Si el muestreo se realiza sin reemplazamiento en una población
finita, no normal, es posible utilizar el factor de corrección.

σ
I .C  X 0 − Z α
n
2

σ
N −n
≤ µ ≤ X 0 + Zα
N −1
n
2
N −n 
 = 1 − α
N −1 
¡Es inusual conocer las varianzas, más allá de la forma de la
población!
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Media de una población
no distribuida normalmente
• Debido a ello, lo más común es estimar las varianzas
poblacionales a partir de las varianzas muestrales.
• Así, la fórmula definitiva es la siguiente:

S0
I .C  X 0 − Z α
n
2

S0
N −n
≤ µ ≤ X 0 + Zα
N −1
n
2
N −n 
 = 1 − α
N −1 
En síntesis, se utiliza esta fórmula cuando no se conoce la forma
funcional de la población ni su varianza, pero n es grande.
• Nota: No olvidar que si n/N es menor o igual a 0.05 no es
necesario adicionar el factor de corrección.
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Ejercicio 3:
IC en poblaciones no normales
• Se desea estimar el nivel de aptitud verbal que presentan personas
condenadas por alguno de los delitos de mayor connotación social
(DMCS).
• De la población de 5500 condenados por DMCS se examina a una
m.a.s de 500 personas y se les administra un test de 120
preguntas.
• En promedio, contestan adecuadamente 65 ítems, con una
desviación típica de 15 .
• Realice la estimación del parámetro media mediante un I.C (con
un nivel de confianza del 95%).
• Considere que se desconocen mayores antecedentes sobre las
características de la población en estudio.
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Ejercicio 3:
IC en poblaciones no normales

S
I .C  X 0 − Z α 0
n
2


15
I .C  65 − 1.96
500

S
N −n
≤ µ ≤ X 0 + Zα 0
N −1
n
2
5500 − 500
15
≤ µ ≤ 65 + 1.96
5500 − 1
500
N −n
N −1

 = 1 − α

5500 − 500 
 = 1 − α
5500 − 1 
I .C ( 65 − 1.96 ⋅ 0.6708 ⋅ 0.9535 ≤ µ ≤ 65 + 1.96 ⋅ 0.6708 ⋅ 0.9535) = 1 − α
I.C( 63.75 ≤ µ ≤ 66.25) =1−α
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Tamaño de la muestra con una
población Infinita
•Cuando surge una investigación resulta imprescindible cuestionarse
sobre el tamaño de la muestra a incluir (y sobre como acceder a
ella).
•Una muestra pequeña puede producir resultados no generalizables
a la población.
•Por otra parte, una muestra excesivamente grande no garantiza
representatividad, e implica gran consumo de recursos (humanos,
temporales, económicos).
 Z α ⋅σ
1−

2
n =

e







2
Z
=
2
1−
e
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
α
2
2
⋅σ
2
Tamaño de la muestra con una
población Infinita
• Especificar el nivel de confianza que adoptará el IC no
resulta problemático (usualmente es 95%).
• El error (proximidad entre los límites del IC y la media
verdadera de la población) también se fija
arbitrariamente.
• Lo complejo resulta estimar la varianza poblacional.
¿Qué soluciones existen?
1. Calcular la varianza en una muestra piloto.
2. Estimar la varianza a través de la revisión de
antecedentes (estudios previos similares al nuestro).
¡El resultado debe ser un número entero!
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Ejercicio 4: Tamaño de la muestra
con una población Infinita
• Volviendo al ejemplo de Tiempo de reacción ante un estímulo.
• Un investigador desea conocer cuantos sujetos debe evaluar para
determinar la media verdadera con un 95% de confianza
• ¿¿Alfa?? ¿¿1-alfa?.
• El investigador no desea tener un error mayor a 0.10 segundos de la
media real del grupo.
• En una muestra piloto, se determinó que la Desviación estándar es igual
a 0.3 segundos.
•¿Qué tamaño debe tener la muestra que necesita el investigador?
 1.962 ⋅ 0.32 
n=

2
 0.10

Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Tamaño de la muestra con una
población Finita
• ¿En qué casos ud. podría conocer el tamaño de la población?
• Ejs: Colegio, Universidad, Empresa, Pacientes en un período de
tiempo.
• En estos casos, se debe agregar el Factor de corrección para la
Población Finita.
N ⋅Z
n=
2
1−
α
⋅σ
2
2
2
Z 2 ⋅ σ 2 + d ( N − 1)
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro
Ejercicio 5: Tamaño de la muestra
con una población Finita
• Un Psicólogo educacional trabaja en una escuela con 2500
estudiantes.
• Desea determinar el tiempo que tardarían en contestar un test
que evalúa función ejecutiva (Ejemplo: Test de Stroop).
• El error en la estimación se establece en 1 minuto.
• Se debe integrar el Factor de corrección para la Población Finita.
• Realice la estimación de la muestra con un IC del 99% y del 95%.
N ⋅ Z2
2
⋅
σ
α
2 2
2500
⋅
2.58
⋅5
2
n= 2 2 2
=
=156.08 ≈157
2 2
2
Z ⋅σ + d (N −1) (2.58 ⋅ 5 ) +1 ⋅ (2500 −1)
1−
Estadística II
Equipo Docente: Iris Gallardo - Andrés Antivilo – Francisco Marro