Download estadística ii - U
Document related concepts
Transcript
Sesión 4 Distribuciones Muestrales Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Esperanza k E(x) = mx = x1 p1 + x2 p2 +.... + xk pk = ∑xi pi i=1 Existen Elementos que permiten resumir información de una Distribución de Frecuencias ¿Ejemplos? También existen elementos que permiten describir la distribución de probabilidad de una variable aleatoria. Definición: “La Esperanza (…) de una variable aleatoria discreta x como la suma de sus posibles valores x1, x2,…, xk ponderados por sus respectivas probabilidades p1, p2,…, pk” (Peña y Romo, 1997, pags. 221‐222) Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Desviación típica de una V.A. σ X = DT ( x) = k 2 ( x − m ) ∑ i x pi i =1 EJERCICIO: Variable Aleatoria: Lanzamiento de una moneda n = 4 X = Número de caras al lanzar la moneda ¿Cuál es la esperanza y su D.T.? Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro X =x P(x) xkpk ( xi − mx ) 2 0 1/16 0 (.0625) 4 .25 1 4/16 1 (0.25) 1 .25 2 6/16 2 (.375) 0 0 3 4/16 3(.25) 1 .25 4 1/16 4 (.0625) 4 .25 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro ( xi − mx ) 2 ⋅ pi Distribuciones Muestrales Una distribución muestral es una distribución de probabilidades de un estadístico muestral calculado a partir de todas las muestras posibles de tamaño n elegidas al azar en una población determinada. OBSERVACIONES 1. Cuando la población es infinita se habla de una distribución muestral teórica. 2. Cuando la población es finita y de tamaño moderado se puede construir una distribución muestral experimental, extrayendo todas las muestras posibles de tamaño n.. CARACTERISTICAS DE INTERÉS • Su Promedio o Media • Su Varianza (y, por tanto, Desviación Estándar) • Su forma (Representación Gráfica) Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Aproximación a las Distribuciones Muestrales EJEMPLO Estudiantes A B C D E Puntaje en test de C.I. 80 90 100 110 120 MEDIA (promedio) = ¿…? 100 VARIANZA = ¿…? 200 Desviación Típica = ¿…? 14,14 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro PASO 1 Se extrae con reemplazo, de la población de 5 sujetos, todas las muestras posibles de tamaño n = 2. En este caso 52 = 25. PUNTAJES 80 90 100 110 80 90 100 110 120 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro 120 PASO 2: Calculo del estadístico MEDIA (Promedio) para cada muestra extraída PUNTAJES 80 90 100 110 120 80 90 100 110 120 80 85 90 95 100 85 90 95 100 105 90 95 100 105 110 95 100 105 110 115 100 105 110 115 120 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro PASO 3 Se realiza una lista con todos los valores distintos de las medias junto con la probabilidad de ocurrencia de cada uno. Medias Frecuencia Probabilidad Medias * Frec 80 1 1/25 80 85 2 2/25 170 90 3 3/25 270 95 4 4/25 380 100 5 5/25 500 105 4 4/25 420 110 3 3/25 330 115 2 2/25 230 120 1 1/25 120 N total = 25 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Suma = 2500 Distribuciones Muestrales Características de interés de la DM de la Media (muestreo con reemplazo): • Media: μX X ∑ = • Varianza: σ X2 = i Nn 2 ( X − μ ) ∑ i X Nn • Forma: El Gráfico debe permitir ver las probabilidades asociadas a cada valor de la variable. Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Distribuciones Muestrales • Media: • Varianza: 2500 μX = 2 = 100 5 2500 σ = = 100 25 2 X • Actividad: Generar el gráfico correspondiente a la DM Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Muestreo con reemplazo Conclusión: Si se efectúa en una población finita, se verifica que el promedio de la distribución muestral de la media es igual a la media de la población original y la varianza de la distribución muestral es igual a la varianza de la población dividida por el tamaño de la muestra (Daniel, 1988) La raíz cuadrada de la varianza se llama Error Típico de la Media σx = σ/√n σx = 14,14/√2 = 10 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Muestreo sin reemplazo Si se desarrolla un muestreo sin reemplazo en una población finita se verifica que: • La distribución de las medias es igual a la media poblacional… •…y la Varianza es igual a σ 2 X ⎛σ 2 ⎞ ⎛ N − n ⎞ =⎜ ⎟ ⋅⎜ ⎟ n N − 1 ⎠ ⎝ ⎠ ⎝ Factor de corrección •Si el tamaño de la muestra es pequeño en relación al tamaño de la población, no es preciso incorporarlo. Si n/N es ≤ 0,05 no es preciso incorporarlo Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro σ σ ⎛ 200 ⎞ ⎛ 5 − 2 ⎞ =⎜ ⎟⋅⎜ ⎟ − 2 5 1 ⎝ ⎠ ⎝ ⎠ 2 X 2 X 3 = 100 ⋅ 4 σ X2 = 75 σX =8.66 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Forma funcional de las medias muestrales a.‐ Muestreo en una población normalmente distribuida Teorema: Si X es la media de una muestra aleatoria de tamaño n sacada de una población distribuída normalmente con media µ y varianza finita σ2 , entonces la distribución muestral de promedios está normalmente distribuída con media µ y y varianza σ2/n Como consecuencia de este hecho z = X − μ σ n X Donde es la media de una muestra aleatoria de tamaño n sacada de una población que se distribuye normalmente con media 0 y varianza 1 Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Ejercicio El tiempo de respuesta de una v. a. ~ N con µ = 10 σ2 =9 ¿Cuál es la probabilidad de que en una muestra aleatoria de 16 animales se obtenga un tiempo promedio de respuesta ≥ 11 segundos? Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro b.‐ Muestreo en poblaciones que no están distribuidas normalmente. Se obtiene una muestra grande de la población y se utiliza el teorema del límite central. “Sin tener en cuenta la forma funcional de la población de donde se extrae la muestra, la distribución de las medias muestrales calculadas con muestras de tamaño n extraídas de una población con media µ y varianza finita σ2 , se aproxima a una distribución normal con media µ y varianza σ2/n cuando n aumenta. Si n es grande, la distribución de las medias muestrales puede aproximarse a una distribución normal.” Una muestra es grande si n≥30. Luego podemos utilizar z Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro Ejercicio La ingestión media de agua es de 16 gramos y la desviación standard es 2 en una población de animales. ¿Cuál es la probabilidad de que la ingestión media de agua para una m. a. de 65 animales esté entre 15,50 y 16,25 gramos? TLC Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro c.‐ Muestreo en poblaciones finitas Sabemos que tenemos que usar el factor de corrección para poblaciones finitas y muestreo sin reemplazo. Ejemplo: Una empresa emplea 1500 personas. El promedio gastado en salud fue de 25,75 euros. Y la desviación = 5,25. ¿Cuál es la probabilidad de que una muestra aleatoria de 100 empleados arroje una media comprendida entre 25 y 27 euros? Estadística II Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro