Download Luego el intervalo de confianza del 95% será
Document related concepts
Transcript
Estimación puntual Una estimación es puntual cuando se usa un solo valor extraído de la muestra para estimar el parámetro desconocido de la población. Al valor usado se le llama estimador. La media de la población se puede estimar puntualmente mediante la media de la muestra: La proporción de la población se puede estimar puntualmente mediante la proporción de la muestra: La desviación típica de la población se puede estimar puntualmente mediante la desviación típica de la muestra, aunque hay mejores estimadores: Intervalos de confianza para la media Supongamos que la estatura de los niños de 2 años está distribuida normalmente con una media de 90 cm y una desviación estándar de 36 cm. ¿Cuál sería la distribución muestral de la media para una muestra de tamaño 9? Recordemos que la media de una distribución muestral de medias es igual a μ : μ=μx Y el error estándar es: n σ σ Para nuestro ejemplo, la distribución muestral de la media tendría una media de 90 y una desviación estándar de 36/3 = 12. Recordemos que la desviación estándar de una distribución muestral es igual al error estándar. Caso de varianza desconocida y común Supondremos la existencia de dos poblaciones sobre las que una variable determinada sigue una distribución Normal con idéntica varianza en las dos. Sobre la población 1, la variable sigue una distribución N(µ1, σ) y, sobre la población 2, sigue una distribución N(µ2, σ). Igualmente supondremos que disponemos de dos muestras aleatorias independientes, una para cada población, de tamaños muestrales n1 y n2 respectivamente. El objetivo es construir un intervalo de confianza, con nivel de confianza (1 − α) · 100 %, para la diferencia de medias µ1 − µ2 El método se basa en la construcción de una nueva variable D, definida como la diferencia de las medias muestrales para cada población Esta variable, bajo la hipótesis de independencia de las muestras, sigue una distribución Normal de esperanza µ1 − µ2 y de varianza La estimación conjunta, a partir de las dos muestras, de la varianza común viene dada por la expresión y, utilizando la propiedad de que la variable sigue una distribución χ2 con n1 + n2 − 2 grados de libertad, podemos construir un estadístico pivote que siga una distribución t de Student y que nos proporciona la fórmula siguiente para el intervalo de confianza para la diferencia de medias: donde tα/2 es el valor de una distribución t de Student con n1 + n2 − 2 grados de libertad que deja a su derecha una probabilidad de α/2. Intervalo de confianza para una proporción Dada una variable aleatoria con distribución Binomial B(n, p), el objetivo es la construcción de un intervalo de confianza para el parámetro p, basada en una observación de la variable que ha dado como valor x. El mismo caso se aplica si estudiamos una Binomial B(1, p) y consideramos el número de veces que ocurre el suceso que define la variable al repetir el experimento n veces en condiciones de independencia. Existen dos alternativas a la hora de construir un intervalo de confianza para p: Considerar la aproximación asintótica de la distribución Binomial en la distribución Normal. Utilizar un método exacto. Aproximación asintótica Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más referenciada en la mayoría de textos de estadística. Se basa en la aproximación que, trasladada a la frecuencia relativa, resulta Tomando como estadístico pivote que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una variable discreta a una continua, se obtiene el intervalo de confianza asintótico: donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha una probabilidad de α/2 para un intervalo de confianza de (1 − α) · 100 %. Las condiciones generalmente aceptadas para considerar válida la aproximación asintótica anterior son: El intervalo obtenido es un intervalo asintótico y por tanto condicionado a la validez de la aproximación utilizada. Una información más general sobre los intervalos de confianza asintóticos puede encontrase aquí. Intervalo exacto Aun cuando las condiciones anteriores no se verifiquen, es posible la construcción de un intervalo exacto, válido siempre pero algo más complicado en los cálculos. Es posible demostrar que un intervalo exacto para el parámetro p viene dado por los valores siguientes: donde Fα/2,a,b es el valor de una distribución F de Fisher-Snedecor con a y b grados de libertad que deja a su derecha una probabilidad de α/2 para un intervalo de confianza de (1 − α) · 100 %. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES Sea X1, X2,..., Xn1 una muestra aleatoria extraída de una población Bernoulli. Sea X la variable Binomial definida como el número de éxitos en esta muestra y con parámetro π 1, proporción poblacional de éxitos. Sea Y1, Y2,..., Yn2 una muestra aleatoria extraída de una población Bernoulli. Sea Y la variable Binomial definida como el número de éxitos en esta muestra y tomemos a π 2 como la proporción de éxitos en esta otra población. Supongamos que ambas muestras son independientes. Si p1 y p2 son los estadísticos muestrales y definimos a = p1-p2 como el estimador de la diferencia de proporciones poblacionales θ = π1-π2 entonces se debe cumplir que Nota: Si n1 y n2 son bastante grandes el radical se calcula usando los estadísticos de la muestra; es decir, las proporciones muestrales. Ejemplo 44 MillWard Brown, empresa investigadora de mercado es requerida para hacer un estudio sobre la preferencia de un producto. Se le pide que estime la proporción de hombres y mujeres que conocen el producto que está siendo promocionado en toda la ciudad. En una muestra aleatoria de 100 hombres y 200 mujeres se determina que 20 hombres y 60 mujeres están familiarizados con el producto indicado. Construya un intervalo de confianza del 95% para la diferencia de proporciones de hombres y mujeres que conocen el producto. En base a estos resultados, ¿se estaría inclinado a concluir que existe una diferencia significativa entre las dos proporciones? Solución Sea π1 la proporción de mujeres que prefieren el producto. Sea π2 la proporción de hombres que prefieren el producto. Según los datos: Se trata de un problema de diferencia de proporciones. Los datos son: Luego el intervalo de confianza del 95% será -0.0009 ≤ π1 – π2 ≤ 0.2009. intervalo de confianza para la varianza de una distribución Normal Dada una variable aleatoria con distribución Normal N(μ; σ), el objetivo es la construcción de un intervalo de confianza para el parámetro σ, basado en una muestra de tamaño n de la variable. A partir del estadístico la fórmula para el intervalo de confianza, con nivel de confianza 1 − α es la siguiente Donde χ2α/2 es el valor de una distribución ji-cuadrado con n − 1 grados de libertad que deja a su derecha una probabilidad de α/2. Por ejemplo, dados los datos siguientes: Distribución poblacional: Normal Tamaño de muestra: 10 Confianza deseada para el intervalo: 95 % Varianza muestral corregida: 38,5 Un intervalo de confianza al 95 % para la varianza de la distribución viene dado por: que resulta, finalmente La determinación del tamaño muestral en una investigación es de vital importancia, tanto para caracterizar la distribución de la variable, como para fijar el grado de precisión del estudio. El propósito de este artículo es ofrecer ayuda en el cálculo del tamaño muestral cuando se efectúa un estudio de carácter cuantitativo (limitado al uso de un muestreo aleatorio simple, unietápico y fijo), en el cual se utilizan métodos estadísticos inferenciales como medios para el análisis, como ser la estimación estadística, las pruebas de hipótesis y el análisis de experimentos, que requieren de información precisa sobre las variables consideradas, y que es obtenida a partir de la muestra representativa de la respectiva población. El artículo presenta varias ecuaciones para la determinación del tamaño muestral, agrupadas en 6 figuras, usando la ayuda didáctica de los árboles de decisión, que facilitan su elección. Con el fin de ejemplificar la manera de utilizar los árboles de decisión para la elección de la ecuación adecuada en el cálculo del tamaño muestral, se muestra un ejemplo de investigación, que es desarrollado completamente, desde la concepción del problema hasta las conclusiones finales. Por otro lado, se exponen algunas bases teóricas y empíricas que ayuden a utilizar de la mejor manera posible las distintas ecuaciones que permiten el cálculo del tamaño muestral.