Download Presentación de PowerPoint
Document related concepts
Transcript
Distribuciones derivadas del muestreo DISTRIBUCIONES DERIVADAS DEL MUESTREO Cuando se trata de una muestra de datos seleccionados aleatoriamente de una población, surge la pregunta de si las estadísticas observadas en esa muestra serán parecidas a las estadísticas de población de donde se obtuvo la muestra. 2 DISTRIBUCIONES DERIVADAS DEL MUESTREO Por ejemplo, si obtenemos al azar muestras de frijol almacenado, medimos el contenido de proteína, y obtenemos el promedio de proteína de ese frijol, la pregunta que nos hacemos es: ¿Es ese valor promedio de proteína parecido al contenido de proteína promedio de todo el frijol almacenado en el país o en la región? 3 DISTRIBUCIONES DERIVADAS DEL MUESTREO En primer lugar se debe establecer que un estadístico de una muestra aleatoria (como la media de la muestra, la varianza, la desviación estándar o cualquier otro), va a tener una distribución derivada del modelo de distribución que estamos suponiendo que tienen las observaciones que componen la muestra. La variable x de la muestra se distribuye como: 4 DISTRIBUCIONES DERIVADAS DEL MUESTREO Se desea determinar el calibre promedio de cierto tipo de árbol que crece en una región (El calibre de un árbol es su diámetro, medido seis pulgadas arriba de la tierra). Para este estudio se toma una muestra aleatoria de 16 árboles que miden 13 pies de altura, y se mide el calibre de cada uno de ellos. Se obtienen los siguientes resultados: 2.3, 1.9, 1.7, 2.1, 1.5, 1.8, 1.8, 1.1, 2.1, 1.5, 2.0, 1.6, 1.3, 1.6, 1.5, y 1.3. x 1.7 s 0.332 5 DISTRIBUCIONES DERIVADAS DEL MUESTREO Suponemos que los calibres de los árboles siguen una distribución normal, y sabemos que los parámetros del modelo de distribución normal serán: = Calibre promedio de todos los árboles de 13 pies de altura que crecen en esa región. =Desviación estándar del calibre de los árboles que tienen las características especificadas. Surge entonces la idea de estimar con la media muestral y con la desviación estándar de la muestra. Así: 1.7 es una estimación de 0.332 es una estimación de 6 12 11 10 9 8 7 6 5 4 3 2 1 0 DISTRIBUCIONES DERIVADAS DEL MUESTREO ¿Podemos suponer que los árboles (de 13 pies de altura) de toda la región tendrán un calibre promedio de 1.7? Esto va a depender de cómo se distribuye el calibre de los árboles, de si su variación es grande o chica, y del tamaño de la muestra de árboles. 7 12 11 10 9 8 7 6 5 4 3 2 1 0 DISTRIBUCIONES DERIVADAS DEL MUESTREO Lo que se va a saber en esta unidad es que la media de la muestra es un buen estimador de la media de la población, y que depende de la varianza y del tamaño (n) de la muestra, qué tan lejos o tan cerca pueda estar la media de la muestra de la verdadera media de la población. 8 DISTRIBUCIONES DERIVADAS DEL MUESTREO ¿Qué sucede si otras personas también están estudiando el calibre de los árboles de esa región, y tienen muestras con promedios y desviaciones estándar diferentes ? Media = 1.96 Dev. St. = 0.38 Media = 1.83 Dev. St. = 0.60 Media = 1.91 Dev. St. = 0.48 9 DISTRIBUCIONES DERIVADAS DEL MUESTREO Es por ello, que cuando tenemos una muestra, decimos que el promedio estimado de la población de árboles será de 1.7. Respecto a la posibilidad de que haya otras muestras con diferentes promedios y desviaciones estándar, esto se deduce del modelo de distribución que se supuso para la población. Si los valores aleatorios de calibre siguen un modelo de distribución normal, los promedios de cada muestra aleatoria tendrán también una distribución normal. 10 DISTRIBUCIONES DERIVADAS DEL MUESTREO Los estadísticos de la muestra tienen una distribución de probabilidades derivada de la distribución de la variable aleatoria con la que se calcula el estadístico. Si la media de la muestra procede de valores de X con una distribución binomial [XB(np, npq)], la media muestral tendrá una distribución binomial: [ X B(p, pq/n)] Si la media de la muestra procede de valores de X con una distribución de Poisson, la media tendrá una distribución Poisson, con media , y varianza /n. 11 Distribuciones derivadas del muestreo Una de las propiedades de la media de la muestra, es que cualesquiera que sea la distribución de X, cuando la muestra es suficientemente grande, la media de la muestra tendrá una distribución aproximadamente normal. Esto se deriva del Teorema Central del Límite. 12 Teorema central del límite Si se tiene una muestra aleatoria de tamaño n, tomada de una población con un valor de la media y un valor dado de la varianza, y si n es suficientemente grande, la media de la muestra se distribuye aproximadamente normal con media igual a la media de la población y varianza igual ala varianza de la población dividida n (2/n). Es así que la variable aleatoria: X / n se distribuirá aproximadamente normal con media 0 y varianza 1 (o sea tendrá una distribución normal estándar). 13 Distribución de la media muestral X tiene alguna distribución con media 1.7 y varianza 0.81. La media de una muestra de tamaño 100 tendrá una distribución con media 1.7 y varianza 0.0081. 12 11 10 9 8 7 6 5 4 3 2 1 0 Distribución de X Distribución de X Desv. estándar = 0.9 Desv. estándar = 0.09 Media = 1.7 14 Distribución Z de la media de la muestra Dos reglas para calcular la media y la varianza de una nueva variable (NX) que es una transformación lineal de otra (X): Sea la transformación: Donde NV=Nueva variable μ =media poblacional de X σ = desv. estándar de X NX X NX X La media poblacional de NX será: Media (NX) - μ La varianza poblacional de NX será: 1 Var(NX) 2 15 Distribución estandardizada de la media de la muestra ( Z ) Si la nueva variable es la media de la muestra, la media de la distribución es μ (aplicando el teorema central del límite), y la varianza de la distribución de la media de la muestra es σ2/n, donde n es el tamaño de la muestra. Eso se resume en la ecuación a la derecha. X se distribuye N(, n) 2 Calcule la media y la varianza de Z para la media de una muestra de tamaño 20 (n=20) cuya distribución tiene una media μ de 5 y una varianza σ2 de 0.82 16 Distribución estardardizada de la media de la muestra (X μ) n Zc σ Tabla de Z 0.8431 0.05 Z P [ z > zc ] -1.0 0.8431 1.64 0.05 1.96 0.025 2 0.023 17 Distribución de t de Student 0.3 ( X ) tc sX 0.25 (n-1) = 34 0.2 0.15 P{t > t(34)= 2.3} = 0.01 0.1 0.05 0 sX -3 2 s n -2 -1 0 1 2 3 Valores de t de Student Tabla de t Grados de Libertad (n-1) 0.10 0.05 1 6.314 12.706 2 2.920 4.303 8 1.860 2.306 0.05 0.025 P [ t > tc] 0.15 P [ t >| tc|] 0.075 18 Distribución de Chi-cuadrado {(n 1) s } /( ) 2 c 2 2 Tabla de Chi-Cuadrado Grados de Libertad (n-1) =0.05 = 0.01 1 3.84 6.63 2 5.99 9.21 8 2.73 20.09 50 45 40 35 30 25 20 15 10 5 0 G. de L. = 19 P{2 > 2 (19) = 3.77} = 0.05 0 1 2 3 4 5 6 Valores de Chi-Cuadrado = 0.001 P [ χ2 > χ2c ] = 19 Distribución de F 30 25 s Fc s 2 a 2 b G. de L. Num. = 7 G. de L. Den. = 16 20 15 P {F > F(7,16) =10.5} = 0. 049 10 5 0 0 2 4 6 8 10 12 14 Valores de F Tabla de F Grados de libertad del Numerador (m-1) Grados de Libertad Denominador (n-1) 1 2 8 1 161.45 199.50 238.88 2 18.513 19.000 19.371 4.4590 3.4381 8 5.3177 20 Cálculo de probabilidades El software enseñado hasta el presente (Excel e Infostat) tiene implementado el cálculo de probabilidades. Se harán demostraciones en clase. 21 Ejercicios Se realizarán varios ejercicios con las distribuciones vistas y con el uso de tablas. 22 Resumen Población estadística Muestra Propiedades de la muestra: Muestra aleatoria Muestra representativa Muestra suficiente Procedimientos de muestreo Distribuciones derivadas del muestreo 23