Download Explicación: Varianza
Document related concepts
Transcript
Estadística Descriptiva
SESIÓN 12
Medidas de dispersión
Contextualización de la sesión 12
En la sesión anterior se explicaron los temas relacionados con
la desviación estándar, la cual es una medida para analizar la
incertidumbre de los datos de una muestra, además de la
manera correcta de llevar a cabo su cálculo para conjuntos
agrupados y no agrupados.
Contextualización de la sesión 12
Ahora es necesario conocer la última de las medidas de
dispersión conocida como varianza y los temas relacionados
con esta medida.
Al terminar esta sesión habrás comprendido el concepto de
varianza y calcular e interpretar la varianza para datos
agrupados y no agrupados.
Introducción a la sesión 12
En la sesión anterior se estudió la desviación
estándar como una medida de dispersión que se
emplea para variables de razón y de intervalo. La
desviación estándar se considera una medida
cuadrática que representa el promedio de las
desviaciones (distancias) de los datos muestrales
respecto de su media aritmética, expresada en las
mismas unidades que la variable.
En la presente sesión revisarás el concepto de
varianza, medida que guarda una
relación con la desviación estándar.
estrecha
Explicación: Varianza
La varianza es una medida de dispersión que guarda
relación con la desviación típica o estándar ya que es el
cuadrado de la misma, razón por la cual se representa
como s2.
La fórmula para calcular la varianza de datos no
agrupados está dada por la expresión:
Explicación: Varianza
Dónde:
n=
Numero de datos o elementos de la muestra.
i=
Indice de la suma que toma los valores 1,2,3...n.
xi =
Valor del i-ésimo dato de la muestra.
=
Media aritmética de la muestra.
Explicación: Varianza
Al igual que en el caso de la desviación estándar, en la
práctica es más común el uso de la fórmula que aplica la
corrección de Bessel:
Explicación: Varianza
Calculemos la varianza para el siguiente conjunto de datos no
agrupados:
A = {2, 4, 6, 8, 10}
De este conjunto se desprende que:
n=5
x1 = 2
x2 = 4
x3 = 6
x4 = 8
x5 = 10
Explicación: Varianza
Con estos datos, procedemos a calcular la media aritmética del
conjunto:
Y a continuación se sustituyen los valores anteriores en la
fórmula:
Explicación: Varianza
Tal como se muestra a continuación:
Explicación: Varianza
La fórmula para calcular la varianza de datos agrupados está
dada por la siguiente expresión:
Dónde:
k =a
Número de intervalos de clase en la distribución de frecuencias.
n=
Número de datos o elementos de la muestra.
i=
Índice de la suma que toma los valores 1,2,3...k.
fi =
Frecuencia del i-ésimo intervalo de clase.
xi =
Marca de clase del i-ésimo intervalo de la muestra.
Media aritmética de la muestra.
Explicación: Varianza
Para calcular la varianza en un conjunto de datos agrupados,
también empleamos la versión que incorpora la corrección de
Bessel. Como puede observarse, cada elemento de la fórmula
se toma directamente de la tabla de datos agrupados.
Considerando el caso práctico de una bebida, se toma de la
tabla de datos agrupados las columnas referentes a las
frecuencias de clase (fi) y a las marcas de clase (xi).
Explicación: Varianza
De esta tabla se obtienen los siguientes valores para las
frecuencias de clase:
f1 = 5
f2 = 10
f3 = 30
f4 = 40
f5 = 15
Explicación: Varianza
Asimismo, dado que hay cinco intervalos de clase y la muestra
tiene 100 elementos, los valores de k y n respectivamente son:
k=5
n = 100
Y como ya se determinó en ejercicios anteriores:
= 20
Explicación: Varianza
Al sustituir estos valores en la respectiva fórmula tenemos que:
Conclusión
Las medidas de dispersión describen la variabilidad
o dispersión de los datos obtenidos mediante una
muestra, además, ofrecen información sobre hasta
qué punto las medidas de tendencia central son
representativas como síntesis de la información.
Y por último, cuantifican la separación, dispersión y
variabilidad de los datos que se obtienen a partir de
las medidas de centralización.