Download Intervalos de Confianza

Document related concepts

Intervalo de confianza wikipedia , lookup

Estimador wikipedia , lookup

Estimación estadística wikipedia , lookup

Distribución t de Student wikipedia , lookup

Error estándar wikipedia , lookup

Transcript
Intervalos de Confianza
Una muestra: El caso de una
media
• En la teoría de Probabilidad se supone
que se conocen todos los parámetros de
una distribución de probabilidad, que en la
estadística ocurre lo contrario.
• El problema central en la estadística es
usar los datos experimentales de
observación para realizar inferencias
acerca de los parámetros que son
desconocidos a priori.
• A los estadísticos utilizados para estimar valores
de un parámetro desconocido, por ejemplo
llámesele q, se le denomina un estimador de q.
Al valor observado para el estimador se le llama
el estimado. Por ejemplo: si se tiene una
muestra de 5 datos, con los datos: X1= 3, X2=
5, X3=6, X4=4, X5=3, el estimado de la media
poblacional para la población de donde proviene
los datos se obtiene del estimador
• Así la media muestral es un estimador de
la media poblacional m. Claro que no se
puede esperar que la media muestral sea
exactamente igual a la media poblacional
m, solamente se podrá esperar que esta
cercana a su valor.
• Es por esta “limitación” que en muchas
ocasiones resulta más valioso dar un
intervalo dentro del cuál se tenga una alta
confianza de que la media m esta incluida.
• Por ello a continuación se inicia el tema de
la estimación por intervalos.
Estimación puntual y por
intervalos
• Como se dijo, la intención es brindar un
intervalo del que se tenga cierto grado de
confianza de que m este dentro de él. Para
obtener un estimador del intervalo se utiliza la
distribución de probabilidad del estimador
puntual. Así, para el caso del estimador puntual,
cuya distribución de probabilidad es normal con
media m y varianza s2/n se tiene que:
z
xm
s
n
• Es el estadístico normal estándar que
tiene una distribución normal con media 0
y varianza 1. De la curva de la distribución
normal estándar se puede ver que:


xm
P  z 0.025  z 
 z 0.975   0.95
s n


probabilidad
Distribución Normal Estandar
cuantiles normales (z)






xm
xm
P  z / 2  z 
 n
 z / 2   1  
s
s n



s
s 
P  z / 2
 x  m  z / 2
  1
n
n

• Al multiplicar a ambos lados por –1 se
obtiene una expresión equivalente y
cambiar el sentido de la desigualdad, se
despeja m: 
s
s 
P  x  z / 2

n
 m  x  z / 2
• Por ejemplo si asumimos = 0.05

s
s 
P  x  1.96
 m  x  1.96
  0.95
n
n

  1
n
• Esta última expresión define que el 95%
de las veces m estará a no más de
1.96s/n unidades de la media muestral.
De esta expresión se obtiene el intervalo
del confianza del 95% para m.
• Nótese que el intervalo anterior requiere el
conocimiento de la varianza s2 lo cual en
la práctica es difícil de que suceda.
Definición
• Si es la media muestral de una muestra
aleatoria de tamaño n de una población
con varianza conocida s2 , un intervalo de
confianza para m del 100(1-)% esta dado
por:
x  z
s
2
n
 m  x  z
s
2
n
z /2 es el punto de la distribución normal
estándar que corresponde al área de
probabilidad /2.
• Este intervalo brinda buenos resultados
principalmente para muestras tomadas de
una población cuya distribución de
probabilidad es normal, o bien, para
muestras de tamaño n >= 30. Para el caso
de muestras pequeñas tomadas de
poblaciones cuya distribución no sea
normal no se puede esperar un buen
resultado de la aplicación del mismo.
Ejemplo 1:
• Suponga que se reciben 35 bolsas de
café, el contenido promedio de las
mismas es 348 gramos.
• Calcular los intervalos 95% y 99%
para el contenido medio de café de
estas bolsas. Asumir que la
desviación estándar poblacional es
de 8 gramos.
Intervalo del 95% de nivel confianza:
x
= 348, s= 8
95% nivel de confianza, esto es =0.05:
z /2, esto es z0.05/2 , z 0.025 = 1.96:
348  1.96
8
 m  348  1.96
35
345.35  m  350.65
8
35

Intervalo 99% nivel de confianza:
99% nivel de confianza, esto es =0.01:
z /2=
348  2.575
8
 m  348  2.575
35
344.52  m  351.48
8
35

• Nótese como el intervalo del 99% de
nivel de confianza ofrece mayor
confianza pero al ser más amplio el
intervalo que brinda puede ser de
menor utilidad.
• Entre más amplio sea el intervalo de
confianza más confianza se puede
tener de que contenga al parámetro
desconocido.
• Sin embargo, en muchas ocasiones será
preferible un intervalo del 95% de
confianza de que la vida de un motor esta
entre 3 y 7 años que tener un intervalo de
confianza del 99% que diga que esta vida
promedio esta entre 1 y 10 años.
Intervalo de confianza unilateral
• En algunas ocasiones se puede estar
interesado en afirmar, con algún nivel de
confianza, por ejemplo 95%, que m es por
lo menos tan grande o por lo menos tan
pequeño como algún valor determinado.
• Para establecer este valor, se puede
empezar por observar que si Z es una
variable aleatoria normal estándar,
entonces de la siguiente figura
z
z
P ( Z < z  ) = 1-, si se supone  como
0.05 entonces se tendría 1-
Con lo cual: P ( Z < 1.645 ) = 0.95


n
P x  m
 1.645  0.95
s








s
P  x  1.645
 m   0.95
n


Definición
• Si es la media muestral de una muestra aleatoria de
tamaño n de una población con varianza conocida s2, un
intervalo de confianza para m del 100(1-)% unilateral
inferior esta dado por:
x  z
• Y el superior inferior por:
m  x  z
s
n
m
s
n
• donde z  es el punto de la distribución normal estándar que
corresponde al área de probabilidad .
Ejemplo 2: Determinar los estimados de intervalo
de confianza inferior y superior del 95% para el
ejemplo 1.
x
348, s= 8
• Intervalo inferior 95% nivel de confianza,
con z , esto es z 0.05 = 1.645
x  z
s
n
 m  348  1.645 *
345.78  m
8
35
m
• Intervalo superior 95% nivel de confianza,
con z , esto es z 0.05 = 1.645
m  x  z
m  348  1.645 *
8
35

s
n
m  350.22
Tamaño de muestra
• En ocasiones es necesario conocer que tan grande
debe ser la muestra para poder hacer una afirmación del
intervalo de confianza para la media.
• Por ejemplo, suponga que por experiencia se sabe que
el peso de las tilapias criadas en una planta se comporta
de manera normal, con una desviación estándar
constante de 0.4 kilogramos. Si se requiere tener un
95% de confianza de que el estimado del peso promedio
de las tilapias sea correcto, un intervalo que realmente
contenga a m, dentro de un límite, suponer de +/- 0.01
kilogramos ¿Cuántas tilapias se deberán recolectar?
• De acuerdo con la ecuación del intervalo
de confianza anterior, el valor estimado no
dista más del calculado que los límites del
intervalo, además hay que recordar que
solamente se aproxima m, pero no
necesariamente se va a coincidir con el
valor real, va a estar cerca, pero ser un
poco más grande o pequeño, como se
muestra en la siguiente figura:
m?
x  z
s
2
n
m?
x
m?
x  z
s
2
n
• Del intervalo de confianza es posible tener
seguridad de que no estará a mas de
cierto error ( ± cierto error) de m siempre
puesto que:
z
s
2
n
 error
• Para el ejemplo el error solicitado fue de 0.01, por lo
que:
s
z
 0.01
2
n
1.96
0.4
n
 0.01
n  78.4
• Se requieren por lo menos 6147 tilapias para hacer el
estudio y obtener un error tan pequeño como 0.01 de
la estimación de la media m.
• En general se especifica que n debe ser al
menos
 z / 2s 
n

 E 
2
Cuando se desconoce s2
• Si el tamaño de muestra es grande,
n ≥ 30 se puede utilizar s como
aproximación de s, aún cuando la
normalidad no se pueda suponer. Esto
por cuanto más buena será la
aproximación entre más datos se tenga.
• De lo contrario se puede recurrir a la
variable aleatoria T que tiene una
distribución t de Student con v = n-1 grados
de libertad.
xm
T
s
n
t
t  /2


xm
P  t  t 
 t   1  
2
2
s n



s
s 
P  t
 x  m  t
  1
2
n
 2 n
• Al multiplicar * -1 y despejar m

s
s 
P  x  t
 m  x  t
  1
2
2
n
n

• Esta última expresión define el intervalo de
confianza para una media para el caso
cuando se desconoce la varianza y la
muestra es pequeña.
Definición
• Si es la media muestral de una muestra
aleatoria de tamaño n de una población con
varianza desconocida s2, un intervalo de
confianza para m del 100(1-) % esta dado por:
x  t
s
2
n
 m  x  t
s
2
n
• t /2 es el punto de la distribución t-student que
corresponde al área de probabilidad /2.
Ejemplo
Intervalo unilateral
• Se maneja al igual que para el caso del
intervalo de confianza de una media con
varianza conocida, el cambio radica en
que ya sea intervalo superior o inferior se
toma el estadístico t - student con  y no
/2 área de probabilidad
Tamaño de muestra
• Para determinar el tamaño de muestra
requerido para establecer el intervalo, se
procede al igual que se hizo con el caso
del intervalo de confianza de una media
con varianza conocida.