Download Explicación: Varianza
Document related concepts
Transcript
Estadística Descriptiva SESIÓN 12 Medidas de dispersión Contextualización de la sesión 12 En la sesión anterior se explicaron los temas relacionados con la desviación estándar, la cual es una medida para analizar la incertidumbre de los datos de una muestra, además de la manera correcta de llevar a cabo su cálculo para conjuntos agrupados y no agrupados. Contextualización de la sesión 12 Ahora es necesario conocer la última de las medidas de dispersión conocida como varianza y los temas relacionados con esta medida. Al terminar esta sesión habrás comprendido el concepto de varianza y calcular e interpretar la varianza para datos agrupados y no agrupados. Introducción a la sesión 12 En la sesión anterior se estudió la desviación estándar como una medida de dispersión que se emplea para variables de razón y de intervalo. La desviación estándar se considera una medida cuadrática que representa el promedio de las desviaciones (distancias) de los datos muestrales respecto de su media aritmética, expresada en las mismas unidades que la variable. En la presente sesión revisarás el concepto de varianza, medida que guarda una relación con la desviación estándar. estrecha Explicación: Varianza La varianza es una medida de dispersión que guarda relación con la desviación típica o estándar ya que es el cuadrado de la misma, razón por la cual se representa como s2. La fórmula para calcular la varianza de datos no agrupados está dada por la expresión: Explicación: Varianza Dónde: n= Numero de datos o elementos de la muestra. i= Indice de la suma que toma los valores 1,2,3...n. xi = Valor del i-ésimo dato de la muestra. = Media aritmética de la muestra. Explicación: Varianza Al igual que en el caso de la desviación estándar, en la práctica es más común el uso de la fórmula que aplica la corrección de Bessel: Explicación: Varianza Calculemos la varianza para el siguiente conjunto de datos no agrupados: A = {2, 4, 6, 8, 10} De este conjunto se desprende que: n=5 x1 = 2 x2 = 4 x3 = 6 x4 = 8 x5 = 10 Explicación: Varianza Con estos datos, procedemos a calcular la media aritmética del conjunto: Y a continuación se sustituyen los valores anteriores en la fórmula: Explicación: Varianza Tal como se muestra a continuación: Explicación: Varianza La fórmula para calcular la varianza de datos agrupados está dada por la siguiente expresión: Dónde: k =a Número de intervalos de clase en la distribución de frecuencias. n= Número de datos o elementos de la muestra. i= Índice de la suma que toma los valores 1,2,3...k. fi = Frecuencia del i-ésimo intervalo de clase. xi = Marca de clase del i-ésimo intervalo de la muestra. Media aritmética de la muestra. Explicación: Varianza Para calcular la varianza en un conjunto de datos agrupados, también empleamos la versión que incorpora la corrección de Bessel. Como puede observarse, cada elemento de la fórmula se toma directamente de la tabla de datos agrupados. Considerando el caso práctico de una bebida, se toma de la tabla de datos agrupados las columnas referentes a las frecuencias de clase (fi) y a las marcas de clase (xi). Explicación: Varianza De esta tabla se obtienen los siguientes valores para las frecuencias de clase: f1 = 5 f2 = 10 f3 = 30 f4 = 40 f5 = 15 Explicación: Varianza Asimismo, dado que hay cinco intervalos de clase y la muestra tiene 100 elementos, los valores de k y n respectivamente son: k=5 n = 100 Y como ya se determinó en ejercicios anteriores: = 20 Explicación: Varianza Al sustituir estos valores en la respectiva fórmula tenemos que: Conclusión Las medidas de dispersión describen la variabilidad o dispersión de los datos obtenidos mediante una muestra, además, ofrecen información sobre hasta qué punto las medidas de tendencia central son representativas como síntesis de la información. Y por último, cuantifican la separación, dispersión y variabilidad de los datos que se obtienen a partir de las medidas de centralización.