Download lectura 05: intervalos de confianza y tamaño de muestra (parte i)

Document related concepts

Intervalo de confianza wikipedia , lookup

Error estándar wikipedia , lookup

Estimador wikipedia , lookup

Distribución t de Student wikipedia , lookup

Estimación estadística wikipedia , lookup

Transcript
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS
LECTURA 05: INTERVALOS DE CONFIANZA Y TAMAÑO DE MUESTRA (PARTE I)
TEMA 9: INTERVALOS DE CONFIANZA: INTRODUCCIÓN Y DEFINICIÓN
1. INTRODUCCION
Actualmente se debe estar bien consciente de que las poblaciones son generalmente muy
grandes como para ser estudiadas en su totalidad. Su tamaño requiere que se
selecciones muestras las cuales se pueden utilizar para hacer inferencias sobre
poblaciones. Por ejemplo si un gerente de una tienda minorista desea saber sobre sus
ventas diarias promedios por cliente durante el año anterior, podría encontrar difícil
calcular el promedio de las ventas a cientos o quizás miles de clientes que pasaron por la
tienda. Seria muchos mas fácil estimar la media poblacional con la media de una muestra
representativa.
Hay dos tipos de estimadores que se utilizan más comúnmente para este propósito: un
estimador puntual y un estimador por intervalo. Un estimador puntual utiliza un
estadístico para estimar el parámetro en un solo valor o punto. El estimador puntual por
ser un solo numero, no proporciona por si mismo información alguna sobre la precisión y
confiabilidad de la estimación. Debido a la variabilidad de la muestra, nunca se tendrá que
x   . El estimado puntual nada dice sobre lo cercano que esta de  . El gerente de la
tienda puede seleccionar una muestra de n=500 clientes y halla el gasto promedio de
x  $120 , este valor sirve como estimación puntual para la media poblacional.
Una alternativa para reportar un solo valor del parámetro que se esta estimando es
calcular e informar todo un intervalo de valores factibles, un intervalo de confianza. El
gerente puede decidir que la media poblacional esté entre $116 y $124. Tal intervalo con
frecuencia va acompañado de una afirmación sobre el nivel de confianza que se da con
exactitud. Por lo tanto se llama intervalo de confianza.
En realidad hay tres niveles relacionados comúnmente con los intervalos de confianza:
99%, 95% y 90%. El gerente mencionado puede tener un 95% de confianza en que la
media poblacional está entre $116 y $124.
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
1
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS
2. DEFINICION
Es el rango dentro del cual se encuentra el parámetro desconocido  con un nivel de
confianza dado.
correspondiente estadística q̂ , se trata de
encontrar un intervalo [L1, L2] llamado Intervalo de Confianza que debe contener el
parámetro  con una probabilidad dada (1-) llamado nivel de confianza.
En base a una muestra aleatoria y la
Si ̂ es una estadística
f( ̂ )
1-
/2
/2
̂
L1
L2
θ
fig. 11
El intervalo [L1, L2] es un intervalo aleatorio ya que sus extremos L 1, L2 llamados límites de
confianza son variables cuyos valores varían de una muestra a otra.
La Estimación Interválica consiste en calcular L 1, L2 dada una muestra aleatoria y un
nivel de confianza (1-) y decir que se tiene confianza del 100 (1-) % que el intervalo
contiene el valor desconocido .
Por ejemplo: Si 1- = 0.95, se dice que se tiene una confianza del 95% que el intervalo
contenga el valor desconocido ; o bien, de 100 intervalos aleatorios que se tomen 95 de
las veces contendrá el parámetro y sólo 5 veces no lo contendrá.
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
2
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS
TEMA 10: INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL HACIENDO
USO DE LA ESTADISTICA Z Y T.
1. INTRODUCCIÓN
Uno de los usos más comunes de los intervalos es estimar la media poblacional. Un
fabricante puede querar estimar la producción mensual promedio de su planta, un
representate de ventas puede estar interesado en estimar su comisión media anual
ganada por captaciones, el jefe financiero de un banco puede estar interesado en estimar
el ahorro mensual promedio de sus clientes en un año dado, etc. El número de
circunstancias que se encuentran comunmente en el mundo de los negocios y que
requiere de una estimación de la media poblacional es casi ilimitado.
2. DEFINICIÓN
Es el rango dentro del cual se encuentra la media poblacional con un nivel de confianza
dado.
PL 1    L 2   1  
1-
/2
μ
L1
/2
L2
fig. 12
Se presentan los siguientes casos:
CASO I: Uso de la Estadística Z.
i) Muestra grande (n  30), varianza poblacional conocida 2 y población normal o no.
L1 = x - Z0 ´ s x = x - Z0 ´
s
n
L 2 = x + Z0 ´ s x = x + Z0 ´
s
n
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
3
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS
ii)

2
2
Muestra grande (n  30), varianza poblacional desconocida   s

y población
normal o no.
iii)
L1 = x - Z 0 ´ s x = x - Z0 ´
s
n
L2 = x + Z0 ´ s x = x + Z0 ´
s
n
Muestra pequeña (n < 30), varianza poblacional conocida  2 y población normal.
L1 = x - Z 0 ´ s x = x - Z 0 ´
s
n
L 2 = x + Z0 ´ s x = x + Z0 ´
s
n
CASO II: Uso de la Estadística t.
Muestra pequeña (n < 30), varianza poblacional desconocida

2
 s2

y población
normal.
L1 = x - t 0 ´ s x = x - t 0 ´
s
n
L2 = x + t 0 ´ s x = x + t 0 ´
s
n
Donde:
t 0  t 1  / 2 , n -1
2. ERROR ESTÁNDAR DE LA MEDIA
El error estándar es una medida de la dispersión de las medias de muestras alrededor de
la media de la población. Si la dispersión disminuye (si  se hace más pequeña),
entonces los valores tomados por la media de la muestra tienden a agruparse mas
cercanamente alrededor de  . Y a la inversa, si la dispersión se incrementa (si  se
agranda), los valores tomados por la media de la muestra tienden a agruparse menos
cercanamente alrededor de  . Al disminuir el error estándar, el valor de cualquier media
de muestra probablemente se acercara al valor de la población, lo que quiere decir que al
disminuir el error estándar, se incrementa la precisión con que se puede usar la media de
la muestra para estimar la media de la población.
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
4
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS

Si el muestreo es con o sin reposición en una población infinita (o con sustitución en
una población finita de tamaño N), el error estándar de la media muestral es:

 ( 2 conocida )
i)  x 
n
ii)

s
 ( 2 desconocida )
n
sx 
Si el muestreo es sin reposición en una población finita de tamaño N, el error estándar
de la media muestra es:
i)  x 

Nn

 ( 2 conocida )
N 1
n
ii) s x 
s
Nn

 ( 2 desconocida )
N 1
n
Donde:
Nn
es el factor de corrección para población finita.
N 1
NOTA: Generalmente se utiliza el muestreo sin reposición en poblaciones infinitas
y finitas de tamaño N
Ejemplo 1:
Se desea estimar el sueldo mensual promedio de los trabajadores de una Empresa “X”
para ello se selecciona una muestra aleatoria de 40 trabajadores donde se obtiene que
x = 720 soles y s = 9 soles . Obtener un intervalo de confianza para el sueldo promedio de
todos los trabajadores con un nivel de confianza del 95%.
Solución:
a)
Se desea estimar:
μ: El sueldo mensual promedio poblacional de los trabajadores.
b)
Análisis:
n = 40
(n>30)
x = 720 soles
s = 9 soles.
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
5
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS



2
2
Varianza poblacional desconocida   s se estima a través de la muestra. Es
decir si s = 9 soles entonces s 2 = 81 soles 2

Población no normal

Para un nivel de confianza 1 – α = 0.95

Error estándar de la media muestral x es:
sx =
s
=
n
Z O  1.96
9
= 1.42
40
c)
Haremos uso de la estadística Z descrita en el Caso I – ii:
d)
Hallando el intervalo de confianza:
s
9
L1 = x - Z0 ´
= 720 - 1.96 ´
n
40
s
9
L 2 = x + Z0 ´
= 720 + 1.96 ´
n
40
L1 = 720 - 1.96 ´ 1.42
L 2 = 720 - 1.96 ´ 1.42
L1 = 720 - 2.78 = 717.22 soles
L 2 = 720 + 2.78 = 722.78 soles
e)
Interpretación:
El sueldo mensual promedio de los trabajadores varia entre 717.22 soles y 722.78
soles con una confianza del 95%.
Ejemplo 2:
El gerente de una cadena de tiendas de ropa desea el número de clientes que realizan
compras, para esto selecciona una muestra al azar entre todas las cadenas de tiendas
donde obtuvo los siguientes resultados respecto al número de clientes:
907, 926, 506, 741, 789, 889, 874, 510, 529, 420
Si se supone que la variable número de clientes se distribuye normalmente con varianza
40000 clientes2 . Hallar el intervalo de confianza del 95% para el número de clientes
promedio que realizan compras.
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
6
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS
Solución:
a)
Se desea estimar:
μ: El número de clientes promedio de clientes que realizan compras.
b)
Análisis:

●
n=10
(n<30)
x = 709.1 clientes
(
Varianza poblacional conocida s = 40000 clientes
2
2
),
entonces la desviación
estándar es s = 200 clientes.

Población normal.

Para el nivel de confianza 1 – α = 0.95

Error estándar de la media muestral x :
sx =
Z O  1.96
s
200
=
= 63.24 clientes
n
10
c) Haremos uso de la estadística Z descrita en el Caso I - iii
d)
Hallando el intervalo de confianza:
s
63.24
L1 = x - Z0 ´
= 709.1 - 1.96 ´
n
10
s
63.24
L 2 = x + Z0 ´
= 709.1 + 1.96 ´
n
10
L1 = 709.1 - 1.96 ´ 19.20
L 2 = 709.1 - 1.96 ´ 19.20
L1 = 709.1 - 37.63 = 671.47 @ 671 clientes
L 2 = 709.1 + 37.63 = 746.73 @ 747 clientes
e) Interpretación: Con una confianza del 95% el número de clientes promedio que
realizan compras en las tiendas varia entre 671 y 747 clientes.
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
7
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS
Ejemplo 3:
Se desea estimar el gasto medio mensual de consumo de teléfono para ello se elige una
muestra aleatoria de 81 clientes de Telefónica S.A., obteniéndose una media x  250 soles
y una desviación estándar s  16 soles . Obtener un intervalo de confianza del 90% para µ.
Solución:
a) Se desea estimar:
μ: El gasto medio mensual de consumo de teléfono en soles.
b) Análisis:
●
x = 250 soles
n = 81
(n>30)
s = 16 soles.

Varianza poblacional desconocida (s2 @ s 2 ) se estima a través de la muestra. Es
decir si s = 16 soles entonces s 2 = 256 soles 2

Población normal.

Para el nivel de confianza 1 – α = 0.90
ZO = 1.645


El error estándar de la media muestral
sx =
es:
s
16
=
= 1.78
n
81
c) Haremos uso de la estadística Z descrita en el Caso I – ii
d) Hallando el intervalo de confianza:
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
8
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS
s
= 250 - 1.645 ´
n
s
L 2 = x + Z0 ´
= 250 + 1.645 ´
n
L1 = x - Z0 ´
16
81
16
81
L1 = 250 - 1.645 ´ 1.78
L 2 = 250 - 1.645 ´ 1.78
L1 = 250 - 2.93 = 247.07 soles
L 2 = 250 + 2.93 = 252.93 soles
e)
Interpretación: Con una seguridad del 90% el gasto medio mensual de consumo
mensual varía entre 247.07 soles y 252.93 soles.
Ejemplo 4:
Con el fin de medir el rendimiento de una máquina (N° de unidades producidas), se toma
una muestra y se obtiene los siguientes resultados: 20, 24, 22, 22, 21, 27, 25. Si sabe
que el rendimiento sigue una distribución normal. Encontrar un intervalo de confianza del
99% para el rendimiento medio.
Solución:
a)
Se desea estimar:
μ: Tiempo medio poblacional de ejecución en milisegundos de un programa.
b)
Análisis:
x = 23 unidades

n=7
(n<30)
s = 2.45 unidades



2
2
Varianza poblacional desconocida   s se estima a través de la muestra.
2
2
Es decir s = 2.45 unidades entonces s = 6.00 unidades
Población normal.
t O = t 0.995,6 = 3.707
Para el nivel de confianza 1 – α = 0.99

El error estándar de la media muestral x es:


___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
9
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS
sx =
s
23
=
= 8.69
n
7
c)
Haremos uso de la estadística t:
d)
Hallando el intervalo de confianza:
s
2.45
= 23 - 3.707 ´
n
7
s
2.45
L2 = x + t 0 ´
= 23 + 3.707 ´
n
7
L1 = x - t 0 ´
L1 = 23 - 3.707 ´ 0.93
L 2 =@ 23 - 3.707 ´ 0.93
L1 = 23 - 3.45 = 19.55 @ 20 unidades
L 2 = 23 + 3.45 = 26.45 @ 26unidades
e)
Interpretación:
El rendimiento medio de la máquina varía entre 20 y 26 unidades con una
confianza del 99%.
Ejemplo 5:
En una empresa distribuidora de productos informáticos trabajan 500 personas. Un
estudio realizado sobre un tamaño de muestra de 30 trabajadores demostró que el sueldo
anual promedio era $450, con una desviación estándar de $50. Estime el sueldo anual
promedio de todos los trabajadores de la empresa con un nivel de confianza del 95%.
Solución:
a)
Se desea estimar:
μ: Sueldo anual promedio de todos los trabajadores.
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
10
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS
b)
Análisis:
x  $450

n=30
s  $50



Varianza poblacional desconocida  2  s 2 es estima a través de la muestra.

Es decir s = 50 $ entonces s = 250$
Población normal.
Se tiene una población finita de tamaño N=500, entonces El error estándar de la
2

2
media muestral x es:
sx 
s
Nn
50
500  30



 8.86
N 1
500  1
n
30
c)
Haremos uso de la estadística Z descrita en el Caso I - ii:
d)
Hallando el intervalo de confianza:
L1 = x - Z0 ´
s
´
n
N-n
45
500 - 30
= 450 - 1.96 ´
´
N -1
500 -1
30
L 2 = x + Z0 ´
s
´
n
N-n
45
500 - 30
= 450 + 1.96 ´
´
N -1
500 - 1
30
L1 = 450 - 1.96 ´ 8.86
L 2 = 450 - 1.96 ´ 8.86
L1 = 450 - 17.37 = $432.63 soles
L 2 = 450 + 17.37 = $467.63 soles
e) Interpretación:
El sueldo anual promedio de todos los trabajadores varía entre $432.63 y $467.37 con
una confianza del 95%.
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
11
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS
TEMA 11: TAMAÑO DE MUESTRA CUANDO EL PARAMETRO ES LA MEDIA
POBLACIONAL USANDO EL MUESTREO ALEATORIO SIMPLE
1. CALCULO DEL TAMAÑO MUESTRAL USANDO EL MUESTREO ALEATORIO
SIMPLE
Característica de la Población
Tamaño de la población infinita o desconocido.
Tamaño de la población finita.
Tamaño de la muestra
Z12 2   2
n
e2
Z12 2  2 N
n 2
Z   2  e 2  ( N  1)
Donde:
n
N
Tamaño de la muestra.
Tamaño de la población.
Valor correspondiente a la distribución de Gauss
Z1-/2
Z0.975 = 1.96 para  = 0.05 y Z0.995 = 2.576 para  = 0.01. (Utilizar

Tabla II).
Valor de la varianza poblacional. En caso de no conocerse se
estima por la varianza muestral (s2) a través de una muestra
e
piloto
Error que se prevé cometer.
e
L1
m
L2
x
fig. 13
Ejemplo 6:
Una muestra de 1225 familias reveló un gasto semanal de promedio de 250 soles y una
desviación estándar de 30 soles. ¿Cuál deberá ser el tamaño mínimo de la muestra para
un error máximo semanal de 4 soles, para un nivel de confianza del 99%?
Solución:
La desviación estándar se ha obtenido a través de una muestra entonces:
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
12
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS

s=30 soles.

Para el nivel de confianza 1 – α = 0.99
e = 4 soles.
La población es infinita o desconocida.


Z0.975 = 2.576
La formula a utilizar será la siguiente:
n=
n=
Z12
2
2
´ s2
e
(2.5.76) 2 ´ (30) 2
(4) 2
n = 373.3 @ 373 familias
Ejemplo 7:
Una muestra aleatoria de los salarios en soles por hora para nueve trabajadores es:
10.5, 11, 9.5, 12, 10, 11.5, 13, 9, 8.5.
El muestro se realizó sobre una población distribuida normalmente y se desea calcular un
intervalo de confianza para el salario promedio de los trabajadores. Hallar el tamaño
mínimo que debe tener la muestrea para que con un nivel de confianza del 95%, el error
de estimación no supere a los 0.3 soles, en una población de 600 trabajadores.
Solución:
La desviación estándar es desconocida y se ha obtiene a través de la muestra:

s = 1.47 soles ´ hora

Para el nivel de confianza 1 – α = 0.95

tener una muestra menor que 30 datos.
e = 0.3 soles.
La población es finita de tamaño N=600 trabajadores.

t 0.95,8 = 1.86
. Se utiliza la estadística t por
La formula a utilizar será la siguiente:
n=
t12-a 2 ´ s 2 ´ N
t12-a 2 ´ s2 + e2 ´ (N - 1)
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
13
Universidad Los Ángeles de Chimbote
CURSO ESTADÍSTICA APLICADA
FACULTAD DE CIENCIAS CONTABLES, FINANCIERAS Y ADMINISTRATIVAS
n=
(1.86) 2 ´ (1.47) 2 ´ 600
(1.86) 2 ´ (1.47) 2 + (0.3) 2 ´ (600 - 1)
n = 76.03 @ 76 trabajadores.
Ejemplo 8:
Se quiere hacer una encuesta para estimar el tiempo promedio por semana que los niños
utilizan la Internet. Por estudios anteriores se sabe que la desviación estándar de dicho
tiempo es de 2.5 horas, con un nivel de confianza del 95% ¿Qué tamaño de muestra se
debería elegir si el error de estimación puntual no es superior a media hora, si se
población de 500 niños de un colegio “X”?
Solución:
La desviación estándar es conocida se ha obtenido a través de la población.

  2.5 horas.

Para el nivel de confianza 1 – α = 0.95

e  0.5 horas.
Z 0.975  1.96

La población es infinita o desconocida.
La formula a utilizar será la siguiente:
n
Z12 2   2  N
Z12 2   2  e 2  ( N  1)
1.96 2  2.5 2  500
n
1.96 2  2.5 2  0.5 2  (500  1)
n  81 niños.
___________________________________________________________________________
Elaborado por : Mg. Carmen Barreto R.
Fecha
: Setiembre 2010
Versión
:2
14