Download Descargar archivo - Estadística inferencial Juan José Hernández

Document related concepts

Intervalo de confianza wikipedia , lookup

Estimador wikipedia , lookup

Error estándar wikipedia , lookup

Estimación estadística wikipedia , lookup

Distribución t de Student wikipedia , lookup

Transcript
ESTIMACIÓN PARAMÉTRICA E
INTERVALOS DE CONFIANZA
Juan José Hernández
Ocaña
• LA estadística inferencial nos permite estimar los parámetros de la población
a partir del análisis de datos de una muestra.
• Si asumimos que no conocemos el verdadero valor de los parámetros de la
población estaríamos considerando que no podemos describir un fenómeno
en particular mediante un modelo probabilístico.
• No obstante, podemos obtener información acerca de los parámetros de una
población de acuerdo a un modelo de probabilidad mediante la observación
repetida de la variable de respuesta a través de una muestra aleatoria
simple de tamaño n de la población
Muestra aleatoria simple
• Condiciones para obtener una muestra aleatoria simple
• La muestra como tal se obtendrá al azar, lo que implica que cada muestra poseerá la
misma probabilidad de ser escogida de las restantes
• Cada elemento de la muestra tendrá siempre la misma probabilidad de haber sido
escogida que los restantes
• Ello significa que si se elige una muestra formada por n elementos (X1, X2..Xn) a partir
de una población representada por la variante X, la distribución de cada Xi será la misma
de X y las variables X independientes entre sí.
CONTRASTE
DE
HIPÓTESIS
ESTIMACIÓN
INFERENCIA
ESTADÍSTICA
Cuando queremos saber los parámetros de una población a partir de los
datos de una muestra aleatoria podemos emplear dos métodos
• Estimación
• Entenderemos por estimación de un parámetro al cálculo del
valor de éste a través de una muestra
• 1.- Llamaremos estimación puntual cuando empleamos
directamente los valores de un solo estadístico sobre una
muestra dada ( estimaciones puntuales)
• 2.- Estimación por intervalo de confianza .- Se calcula un
intervalo de confianza en él que razonablemente se
encuentra el valor estimado con un nivel de confianza
prefijado en términos de probabilidad.
1.-Estimación puntual
• Un estimador puntual es un estadístico aplicado a la determinación de los
caracteres poblacionales que se pretende inferir
• Es un valor individual que se usa para estimar el valor de un parámetro de
población
• Entre los estimadores puntuales más comunes tenemos :
• La proporción muestral del número de éxitos( binomial)
• La media muestral para la distribución de Poisson y distribución Normal.
Estimadores sin sesgo
Estimadores con sesgo
Aquellos cuyos resultados que
consideran a todas las muestras
posibles coinciden con los
parámetros poblacionales
Media
Proporción
Varianza
Desviación estándar (siempre y
cuando el tamaño de la muestra
sea grande el sesgo es pequeño )
Mediana
Rango
• Por ejemplo si ahora mismo
deseáramos conocer el promedio de
calificaciones de todos los alumnos
de Ingeniería de esta Universidad
• Una estimación puntual sería
obtener una muestra y calcular su
media
• Tendríamos un margen de error
dependiendo del tamaño de la
muestra y de las propias
propiedades de la distribución de
los datos de la población
•
La estimación tiene el objetivo de
obtener estadísticas que nos
permitan conocer las características
más relevantes de una población,
utilizando la información de una
muestra
• La principal desventaja es que su
resultado varía de una muestra a
otra
• Variación en la medición?
•
• Error en la medición?
• ¿ Qué hacer?
• ¿ Cómo estimarlo?
Propiedades requeridas de los estimadores puntuales
• 1.- Insesgadez
• Si el valor esperado del estadístico de muestra es igual al parámetro poblacional
que se estima , se dice que es un estimador insesgado del parámetro poblacional.
• 2.- Eficiencia
• Se dice que un estimador puntual con menor desviación estándar tiene una mayor
eficiencia relativa que otro
• 3.- Consistencia
• Un estimador es consistente si sus valores tienden a acercarse al parámetro de la
población conforme se incrementa el tamaño de la muestra
Margen de error
• Cuando reunimos un conjunto de datos muestrales , podemos calcular la media
muestral y por lo general esa media muestral es diferente a la media poblacional
• La diferencia entre la media muestral y la media poblacional es un error
(E) que
podemos calcular en términos de probabilidad
•
En otras palabras podríamos calcular el valor de un parámetro considerando un
margen de error y ese error dependería de las características de la muestra empleada
Error muestral
• Error de muestreo se llama al valor absoluto de la diferencia entre un
estimador puntual insesgado y el parámetro de la población. Por ejemplo en
el caso de una media muestral que estima una media poblacional
• Aunque no es posible determinar el valor del error muestral porque no se conoce
exactamente la media poblacional, si podemos hacer estimaciones sobre su valor
empleando la media muestral
• Es importante anotar que cuando empleamos la media muestral como estimador se debe
emplear la desviación estándar de la media muestral
¿ Y cómo lo haríamos
empleando un estimador
puntual?
Intervalo de confianza
• Es un intervalo de valores que se usan para estimar el valor real
de una parámetro de la población
• Es un rango de números, llamado intervalo, construido alrededor de
la estimación puntual
2.-Intervalos de confianza
• Los intervalos de confianza nos permiten realizar una estimación
de los valores de la población empleando datos muestrales
• Consisten emplear un rango de valores asociado a un nivel de
confianza con lo que podemos determinar valores en términos
de probabilidad
• El ancho del intervalo depende de tres factores
• Nivel de confianza que se determine
• tamaño de la muestra
• desviación estándar de los datos
Intervalo de confianza
α) es el nivel
de confianza
Nos indica en
términos de
probabilidad que
porcentaje de la
población se
encuentra en un
intervalo
especifico.
(1-
Es tima el valor de la media de la población a partir
de la media muestral con cierto margen de error
( denotado por alfa).
• El nivel de confianza es la probabilidad de encontrar el
parámetro de la población en un intervalo de confianza
determinado, siempre y cuando el proceso de estimación se
repita un gran número de veces

Si consideramos un 95% de nivel de confianza, podemos
afirmar que tenemos un 95% de confianza de que en dicho
intervalo se encuentra el parámetro. Esto es, que si
seleccionamos diferentes muestras de tamaño n y
construimos los intervalos correspondientes , en el 95% de
ellos encontraremos el parámetro poblacional
Estadístico empleado
•
•
La media muestral es el mejor estimado puntual de la media de la
población
• La distribución de medias muestrales tiende a tener menor
variación que las distribuciones de otros estadísticos muestrales
( como moda y mediana)
• En la mayoría de los casos la media muestral es un estimador
sin sesgo, esto es, no tienden sistemáticamente a sobreestimar
ni a subestimar el valor de la media poblacional
Desviación estándar de la media muestral
• Nos expresa cuando varía la
media muestral entre una
muestra y otra y es conocida
como error estándar de la
media
• por lo tanto cuando aumenta el
tamaño de la muestra, el error
estándar de la media se reduce
en una factor igual a la raíz
cuadrada del tamaño de la
muestra
σx
=
Desviación estándar de la media muestral
• Podemos emplear dos ecuaciones para calcular la desviación estándar de la
media muestral
σx
=
Población finita
Población infinita
O que sea finita y el
tamaño de la muestra sea
menor al 5% de la
población
• Para estimar la media poblacional µ tenemos algunas
condiciones:
• La muestra es aleatoria simple
• Se conoce el valor de la desviación estándar de la población
• Los datos se distribuyen normalmente
MARGEN DE
ERROR
•
Tamaño de la muestra
Ejercicios
E1
• Una encuesta de satisfacción del servicio al cliente encontró en
una muestra de 100 clientes un promedio de 82 puntos.
Considere que se les pidió que calificaran el servicio con una
puntuación desde 0 a 100 puntos . Si muestras anteriores nos
indican que la desviación estándar de la población es de 20
puntos.
• Estime el intervalo de confianza para un 95% de confianza.
• 𝑛 = 100
𝜎 = 20
• 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 95% por lo que z = 1.96
•
E2
• Un fabricante de papel tiene un proceso de producción que
opera continuamente a lo largo de un turno completo. Se
espera que el papel tenga una media de longitud de 11
pulgadas y una desviación estándar de 0.02. A intervalos
periódicos, se selecciona una muestra para determinar si la
media de longitud de papel es igual a 11 pulgadas o saber si
algo ha salido mal en el proceso de producción. Usted
selecciona una muestra de 100 hojas y encuentra que la
media de longitud es de 10.99 pulgadas. Construya un
estimación del intervalo de confianza del 95% para la media
poblacional. ¿Cuáles son sus conclusiones?
E3
• En una población de 64 estudiantes se determina el nivel de atención de los mismos en las clases de
matemáticas. Los resultados muestran una media de 101. Los datos históricos muestran una desviación
estándar de la población de 2.5
• .Hallar los intervalos de confianza para el valor medio del nivel de atención.
• Use un coeficiente de confianza del 90% y del 95%
• Cuál es el margen de error en ambos casos?
E4
• Se tomaron las temperaturas corporales de 106 alumnos y los datos mostraron una media de 98.20
grados F. Supóngase que se conoce la desviación estándar de la población y que es de 0.62. Para un
nivel de confianza de 95% y para un nivel de confianza del 99%
• Cuál es el margen de error
• Cuál es el intervalo de confianza donde se puede ubicar a la media poblacional?
• 0.1180 para el 95% y 0.1548 para 99%
• (98.08, 98.32) para 95% y ( 98,04 , 98.35)
Y sí quisiéramos tener un margen de error menor?
• Recordemos que conforme aumentamos el tamaño de muestra disminuye el error
• S i consideramos el ejercicio anterior
• Cuál debe ser el tamaño de la muestra para tener un margen de error de solo 0.05
considerando 95% y 99% de nivel de confianza
• Para 95% n debe ser 590
• Para 99% n debe ser 1016
E5
• Una investigación sobre el CI de los 49 docentes de Administración de la
universidad revela que presentan un valor medio de 100 y una desviación estándar
de 15.
• Determine el intervalo de confianza con un alfa de 5%
• ¿ Cuál deberá ser el tamaño de la muestra si queremos tener la confianza del 95%
de que la media muestral estará dentro de 2 puntos de CI de la media poblacional?
E6
• Una máquina de refrescos está ajustada de tal manera que la cantidad de
líquido despachada se distribuye normalmente con una desviación estándar
igual a 0.15litros. S i se toma una muestra de 35 refrescos y los resultados
mostraron una media de 2.25 litros, ¿ cuál es el intervalo de confianza de
95% para la media de todos los refrescos que se sirven en esa máquina?
• Usted quiere asegurar la precisión de los resultados así que decide que el
error permitido sea de 0.025, ¿ de qué tamaño tendría de ser la muestra para
cumplir con dicho propósito?
E7
• Una empresa que produce televisores ha detectado que el ciclo de vida
media de una muestra de 100 televisores es de 48 meses con una desviación
estándar de 2.4 meses. Teniendo un nivel de confianza del 95% ¿ cuál será el
intervalo de confianza del promedio de vida de la población de los
televisores?
• Si quisiera asegurar que el error no exceda a 0.25 unidades , ¿qué tamaño
de la muestra debería emplear?
E8
• Si el gerente de una tienda de artículos para pintura desea estimar la
cantidad media de pintura dentro de una lata de un galón con un error de solo
+- 0.004 con un 95% de confianza y se sabe que la desviación estándar es de
0.02 galones
• ¿ qué tamaño de la muestra necesita?
• Si el gerente de control de calidad desea estimar el promedio de duración de
focos con un error de +- 20 horas con un nivel de confianza de 95% y también
supone una desviación estándar de 100 horas. ¿ qué tamaño de la muestra
necesita?
E9
• Una compañía que renta automóviles quiere saber que cantidad de millas
recorren en promedio en los fines de semana con el fin de establecer un
programa de mantenimiento adecuado. De una población de 23 000 autos, se
toma una muestra de 200 autos y se verifica su recorrido. Los datos de la
muestra presenta un media de 54.5 millas y una desviación estándar de 14.o
millas
• Calcule el intervalo de confianza del 95% para establecer la media de las
millas que recorren los autos en los fines de semana.
•
e10
• Una compañía que vende productos alimenticios para mejorar la engorda de
ganado vacuno introdujo un nuevo compuesto para mejorar dicho proceso. El
gerente quiere estimar el peso promedio diario que ganan los animales al
emplear dicho compuesto. Para ello empleo una muestra de 200 animales y
los resultado presentaron una media de 1.2 libras por día con una desviación
estándar de 0.50libras.
• Obtenga el intervalo de confianza del 95% para estimar el peso promedio
verdadero del aumento de peso
• Obtenga el intervalo de confianza del 90% para estimar el peso promedio
verdadero del aumento del peso
• ¿Puede explicar las diferencias entre los dos resultados anteriores?
E11
• El gerente de producción de una fabrica necesita determinar si una máquina
está produciendo cierto tipo especifico de tela , cuyas especificaciones
señalan que debe tener una resistencia a la ruptura de 70 libras y una
desviación estándar de 3.5 libras. Un muestra de 49 pedazos de tela revela
una resistencia de 69.1libras en promedio
• ¿existe evidencia de que la máquina no está cumpliendo con las especificaciones del
fabricante?
• Emplee un intervalo de confianza del 95%
E12
• Se sabe que el tiempo de secado de cierto tipo de pintura en condiciones de
prueba especificas, tiene una distribución normal con un valor medio de 75
min y desviación estándar de 9 min. Los químicos han propuesto u nuevo
aditivo diseñado para disminuir el tiempo promedio de secado. Debido al
gasto relacionado con el aditivo, la evidencia debe hacer pensar con certeza
en una mejoría en el tiempo de secado promedio antes de adoptar tal
conclusión. Sí una muestra de 35 ensayos dan como resultado un valor
promedio de secado de 70.8, recomendaría el uso del aditivo?
INTERVALOS DE CONFIANZA CUANDO
NO SE CONOCE LA DESVIACIÓN
ESTÁNDAR DE LA POBLACIÓN Y
TENEMOS MUESTRAS PEQUEÑAS
Intervalos de confianza
• Para estimar µ si no se
conoce σ y el tamaño de
la muestra es mayor a 30
y se asume que no se
conoce la distribución de
la población
t1
• La asociación de productores de azúcar desea calcular el consumo medio de
azúcar por año. Una muestra de 16 personas revelo que su consumo
promedio fue de 60 libras, con una desviación estándar de los datos de la
muestra de 20 libras.
• ¿ Construya un intervalo de confianza de 90% par la media de la población ?
• ¿ es razonable concluir que la media poblacional es de 63 libras?
t2
• El propietario de una papelería desea estimar la media del valor al mayoreo
de las tarjetas de felicitación. Para ello toma una muestra aleatoria de 20
proveedores y obtiene un valor medio de 1.67 con una desviación de 0.32 de
los datos
• Suponiendo una distribución normal, construya un intervalo de confianza del 95% para la
media de todas los precios al mayoreo de las tarjetas
t3
• Los siguientes datos representan la tarifa para los cheques sin fondos para
una muestra de 23 bancos con clientes que depositan directamente y
mantienen un saldo de 1000 pesos
• Construya un intervalo de confianza del 95% para la media poblacional de los cheques sin
fondos
260 280 200 200 210 220 250 250 180 250 150 200
180 200 250 250 220 300 300 300 150 200 290
ciudad
hotel
Auto
Ciudad
Hotel
auto
1
2050
470
11
2050
500
2
1790
410
12
1280
320
3
1850
490
13
1650
340
4
2100
380
14
1800
460
5
1280
320
15
1980
410
6
1450
480
16
1580
400
7
1770
490
17
1320
390
8
1170
410
18
2830
670
9
2210
560
19
2690
690
10
1590
410
20
2040
400
• T4 .-Los
siguientes datos
representan el
costo diario de
hotel y renta de
un automóvil en
20 ciudades del
país.
• .Construye un
intervalo de
confianza del
95% para la
media
poblacional del
precio del hotel
y un intervalo de
confianza para
el precio de la
renta de un
automóvil.
t5
• Una compañía farmacéutica está probando una nueva droga para aliviar el
dolor, pero existe preocupación en saber si este producto aumenta el ritmo
cardíaco. Los 14 personas evaluadas tuvieron en promedio un valor de 55
antes de tomar el medicamento. Los datos se presentan en la siguiente tabla
y considere que se distribuyen normalmente
• Construya un intervalo de confianza de 90%
• ¿ Cuáles serían sus conclusiones’
50 70 60 70 90 72 50
80 85 55 66 70 80 40
Estimación del intervalo de confianza para una
proporción
• p proporción de la muestra
• po proporción de la población
• n tamaño de la muestra
• no conocemos la proporción
de la población
Estimamos su valor empleando la
Proporción de la muestra
Tamaño de la muestra
p1
• El propietario de una empresa desea determinar la proporción de clientes que
utilizan tarjeta de crédito para pagar sus cuentas. Para ello entrevisto a 100
clientes durante la semana y encontró que 80 de ellos emplean la tarjeta de
crédito.
• Calcule la proporción de la población que usa tarjeta de crédito
• construya un intervalo de confianza del 95% para la proporción poblacional
p2
• De acuerdo a CWLP , un encuesta realizada con 500 mujeres que
abandonaron sus estudios de licenciatura por razones familiares, indico que el
66% de ellas deseaban regresar a terminar sus estudios.
• Construya un intervalo de confianza del 95% para la proporción poblacional
de mujeres que desean retomar sus estudios de licenciatura
p3
• Una empresa telefónica desea estimar la proporción de hogares que
contrataría una línea telefónica adicional . Se selecciono a una muestra de
500 hogares. Los resultados indican que 135 de los hogares contrataría una
línea adicional.
• Construya una estimación del intervalo de confianza del 99% de la
proporción poblacional de hogares que contratarían una línea adicional.
• La compañía realizará inversiones si encuentran que al menos un 30% de los
usuarios contratarían una línea adicional. ¿Cuáles son sus conclusiones?
p4
• Un estudio efectuado por la Reserva Federal reportó que el 52% de 4440
familias entrevistadas en 2011 poseían acciones.
• Construya un intervalo de confianza del 95% para la proporción poblacional de familias que
tenían acciones en 2011
• Para realizar un estudio de seguimiento que estime la proporción poblacional de familias
que actualmente tienen acciones con un error máximo de 0.01 y un intervalo de confianza
de 95%, ¿ a cuántas familias deberá entrevistar?
p5
• Se llevo a cabo una encuesta para calcular la proporción de amas de casa
que dicen tener problemas de depresión. De las 1400 amas de casa de la
muestra, 420 contestaron que si tienen problemas asociados a la depresión.
• 1.- Construya un intervalo de confianza de 99% para la proporción
poblacional
p6
• Una compañía de diseño compra tazas de plástico para imprimir en ellas
logotipos para sus clientes. Para asegurar la calidad de la mercancía
empleada seleccionó una muestra aleatoria de 300 tazas en cada lote. Halló
que 14 estaban defectuosas en el lote A y 33 de 400 tasas en el lote B
• ¿ cuál es la proporción de la población en ambos casos?
• construya un intervalo de confianza del 95% para el lote A y un intervalo de confianza para
e lote B
• El lote será rechazado si se encuentra un porcentaje mayor al 4% ¿Aprobaría los dos lotes
?
p7
• Un exportador mando a un comprador a China para comprar vajillas de vidrio.
Él está interesado en estimar la proporción de vajillas que tienen algún
defecto. Una muestra aleatoria de 130 productos dio como resultado 13 con
defecto. Basados en esta información, cuál es el intervalo de confianza del
99% para la proporción poblacional
Se conoce la desviación
estándar de la población
No se conoce la
desviación estándar de
la población
Intervalo de confianza para una proporción
INTERVALO DE CONFIANZA DE LA
DIFERENCIA DE DOS MEDIAS
Bibliografía
• Peréz César: Estadística Printice Hall Pearson. 2003 España
• Anderson, Sweeney: Estadística. Math Learning México 2004 octava
edición.
• Levine: Estadística Descriptiva Pearson primera edición México 2012.