Download Luego el intervalo de confianza del 95% será

Document related concepts

Intervalo de confianza wikipedia , lookup

Distribución t de Student wikipedia , lookup

Error estándar wikipedia , lookup

Estadístico muestral wikipedia , lookup

Estimador wikipedia , lookup

Transcript
Estimación puntual
Una estimación es puntual cuando se usa un solo valor extraído de la muestra para estimar el
parámetro desconocido de la población. Al valor usado se le llama estimador.
La media de la población se puede estimar puntualmente mediante la media de la muestra:
La proporción de la población se puede estimar puntualmente mediante la proporción de la
muestra:
La desviación típica de la población se puede estimar puntualmente mediante la desviación
típica de la muestra, aunque hay mejores estimadores:
Intervalos de confianza para la media
Supongamos que la estatura de los niños de 2 años está distribuida normalmente con una
media de 90 cm y una desviación estándar de 36 cm. ¿Cuál sería la distribución muestral de la
media para una muestra de tamaño 9? Recordemos que la media de una distribución muestral
de medias es igual a μ :
μ=μx
Y el error estándar es: n σ σ
Para nuestro ejemplo, la distribución muestral de la media tendría una media de 90 y una
desviación estándar de 36/3 = 12. Recordemos que la desviación estándar de una distribución
muestral es igual al error estándar.
Caso de varianza desconocida y común
Supondremos la existencia de dos poblaciones sobre las que una variable determinada sigue
una distribución Normal con idéntica varianza en las dos. Sobre la población 1, la variable
sigue una distribución N(µ1, σ) y, sobre la población 2, sigue una distribución N(µ2, σ).
Igualmente supondremos que disponemos de dos muestras aleatorias independientes, una
para cada población, de tamaños muestrales n1 y n2 respectivamente.
El objetivo es construir un intervalo de confianza, con nivel de confianza (1 − α) · 100 %, para
la diferencia de medias
µ1 − µ2
El método se basa en la construcción de una nueva variable D, definida como la diferencia de
las medias muestrales para cada población
Esta variable, bajo la hipótesis de independencia de las muestras, sigue una distribución
Normal de esperanza
µ1 − µ2
y de varianza
La estimación conjunta, a partir de las dos muestras, de la varianza común viene dada por la
expresión
y, utilizando la propiedad de que la variable
sigue una distribución χ2 con n1 + n2 − 2 grados de libertad, podemos construir un estadístico
pivote que siga una distribución t de Student y que nos proporciona la fórmula siguiente para el
intervalo de confianza para la diferencia de medias:
donde tα/2 es el valor de una distribución t de Student con n1 + n2 − 2 grados de libertad que
deja a su derecha una probabilidad de α/2.
Intervalo de confianza para una proporción
Dada una variable aleatoria con distribución Binomial B(n, p), el objetivo es la construcción de
un intervalo de confianza para el parámetro p, basada en una observación de la variable que
ha dado como valor x. El mismo caso se aplica si estudiamos una Binomial B(1, p) y
consideramos el número de veces que ocurre el suceso que define la variable al repetir el
experimento n veces en condiciones de independencia.
Existen dos alternativas a la hora de construir un intervalo de confianza para p:
Considerar la aproximación asintótica de la distribución Binomial en la distribución Normal.
Utilizar un método exacto.
Aproximación asintótica
Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más referenciada en
la mayoría de textos de estadística. Se basa en la aproximación
que, trasladada a la frecuencia relativa, resulta
Tomando como estadístico pivote
que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una
variable discreta a una continua, se obtiene el intervalo de confianza asintótico:
donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha una
probabilidad de α/2 para un intervalo de confianza de (1 − α) · 100 %. Las condiciones
generalmente aceptadas para considerar válida la aproximación asintótica anterior son:
El intervalo obtenido es un intervalo asintótico y por tanto condicionado a la validez de la
aproximación utilizada. Una información más general sobre los intervalos de confianza
asintóticos puede encontrase aquí.
Intervalo exacto
Aun cuando las condiciones anteriores no se verifiquen, es posible la construcción de un
intervalo exacto, válido siempre pero algo más complicado en los cálculos. Es posible
demostrar que un intervalo exacto para el parámetro p viene dado por los valores siguientes:
donde Fα/2,a,b es el valor de una distribución F de Fisher-Snedecor con a y b grados de
libertad que deja a su derecha una probabilidad de α/2 para un intervalo de confianza de (1 −
α) · 100 %.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES
Sea X1, X2,..., Xn1 una muestra aleatoria extraída de una población Bernoulli. Sea X la variable
Binomial definida como el número de éxitos en esta muestra y con parámetro π 1, proporción
poblacional de éxitos.
Sea Y1, Y2,..., Yn2 una muestra aleatoria extraída de una población Bernoulli. Sea Y la variable
Binomial definida como el número de éxitos en esta muestra y tomemos a π 2 como la proporción
de éxitos en esta otra población. Supongamos que ambas muestras son independientes.
Si p1 y p2 son los estadísticos muestrales y definimos a
= p1-p2 como el estimador de la
diferencia de proporciones poblacionales θ = π1-π2 entonces se debe cumplir que
Nota:
Si n1 y n2 son bastante grandes el radical se calcula usando los estadísticos de la muestra;
es decir, las proporciones muestrales.
Ejemplo 44
MillWard Brown, empresa investigadora de mercado es requerida para hacer un estudio sobre
la preferencia de un producto. Se le pide que estime la proporción de hombres y mujeres que
conocen el producto que está siendo promocionado en toda la ciudad.
En una muestra aleatoria de 100 hombres y 200 mujeres se determina que 20 hombres y 60
mujeres están familiarizados con el producto indicado. Construya un intervalo de confianza del
95% para la diferencia de proporciones de hombres y mujeres que conocen el producto. En
base a estos resultados, ¿se estaría inclinado a concluir que existe una diferencia significativa
entre las dos proporciones?
Solución
Sea π1 la proporción de mujeres que prefieren el producto.
Sea π2 la proporción de hombres que prefieren el producto.
Según los datos: Se trata de un problema de diferencia de proporciones. Los datos son:
Luego el intervalo de confianza del 95% será -0.0009 ≤ π1 – π2 ≤ 0.2009.
intervalo de confianza para la varianza de una distribución Normal
Dada una variable aleatoria con distribución Normal N(μ; σ), el objetivo es la construcción de un
intervalo de confianza para el parámetro σ, basado en una muestra de tamaño n de la variable.
A partir del estadístico
la fórmula para el intervalo de confianza, con nivel de confianza 1 − α es la siguiente
Donde χ2α/2 es el valor de una distribución ji-cuadrado con n − 1 grados de libertad que deja a su
derecha una probabilidad de α/2.
Por ejemplo, dados los datos siguientes:

Distribución poblacional: Normal

Tamaño de muestra: 10

Confianza deseada para el intervalo: 95 %

Varianza muestral corregida: 38,5
Un intervalo de confianza al 95 % para la varianza de la distribución viene dado por:
que resulta, finalmente
La determinación del tamaño muestral en una investigación es de vital importancia, tanto para
caracterizar la distribución de la variable, como para fijar el grado de precisión del estudio. El
propósito de este artículo es ofrecer ayuda en el cálculo del tamaño muestral cuando se efectúa
un estudio de carácter cuantitativo (limitado al uso de un muestreo aleatorio simple, unietápico y
fijo), en el cual se utilizan métodos estadísticos inferenciales como medios para el análisis, como
ser la estimación estadística, las pruebas de hipótesis y el análisis de experimentos, que requieren
de información precisa sobre las variables consideradas, y que es obtenida a partir de la muestra
representativa de la respectiva población. El artículo presenta varias ecuaciones para la
determinación del tamaño muestral, agrupadas en 6 figuras, usando la ayuda didáctica de los
árboles de decisión, que facilitan su elección. Con el fin de ejemplificar la manera de utilizar los
árboles de decisión para la elección de la ecuación adecuada en el cálculo del tamaño muestral,
se muestra un ejemplo de investigación, que es desarrollado completamente, desde la concepción
del problema hasta las conclusiones finales. Por otro lado, se exponen algunas bases teóricas y
empíricas que ayuden a utilizar de la mejor manera posible las distintas ecuaciones que permiten
el cálculo del tamaño muestral.